<div dir="ltr"><div dir="ltr">Here is the paper for WG14 combing through the identifiers and doing the analysis: <a href="http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1518.htm">http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1518.htm</a><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, May 15, 2019 at 1:39 PM Tom Honermann &lt;<a href="mailto:tom@honermann.net">tom@honermann.net</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
  
    
  
  <div bgcolor="#FFFFFF">
    <div class="gmail-m_-5950599726549270688moz-cite-prefix">Thanks for bringing this to our
      attention.  I agree there are opportunities for improvement here. 
      I filed a new SG16 issue to track this.</div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix"><br>
    </div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix"><a class="gmail-m_-5950599726549270688moz-txt-link-freetext" href="https://github.com/sg16-unicode/sg16/issues/48" target="_blank">https://github.com/sg16-unicode/sg16/issues/48</a></div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix"><br>
    </div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix">I encourage anyone interested in this
      to sign up to write a paper or provide additional background
      material in the issue (e.g., more history about the current list
      of ranges, an analysis of UAX#31 and its applicability to C++,
      etc...).<br>
    </div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix"><br>
    </div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix">Tom.</div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix"><br>
    </div>
    <div class="gmail-m_-5950599726549270688moz-cite-prefix">On 5/10/19 12:43 PM, JF Bastien wrote:<br>
    </div>
    <blockquote type="cite">
      
      <div dir="ltr">
        <div dir="ltr"><font face="arial, helvetica, sans-serif">Hi C++ <span style="color:rgb(0,0,0);font-size:medium">પกٱƈѻɗﻉ</span> <span style="color:rgb(0,0,0);font-size:medium">ḟäṅṡ 👋</span>!</font>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><font face="arial, helvetica, sans-serif">The current
              list of valid identifier characters is pretty silly (see [<b><a href="http://lex.name" target="_blank">lex.name</a></b>]
              5.10 Identifiers or <a href="https://en.cppreference.com/w/cpp/language/identifiers" target="_blank">cppreference summary</a>). It
              allows characters such as zero-width joiner and zero-width
              space among a few silly things (see <a href="https://godbolt.org/z/sBJk1k" target="_blank">how bad this can get</a>,
              h/t Richard Kogelnig</font><span style="font-family:arial,helvetica,sans-serif">).</span></div>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><font face="arial, helvetica, sans-serif">I asked where
              it came from, and IIUC John looked at Unicode and cobbled
              the list of valid ranges manually. That ain&#39;t great.</font></div>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><font face="arial, helvetica, sans-serif">Is this group
              interested in fixing things?</font></div>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><font face="arial, helvetica, sans-serif">There&#39;s already
              an existing standard for this, maybe it&#39;s a thing we can
              adopt as-is or use as a starting point:</font></div>
          <blockquote style="margin:0px 0px 0px 40px;border:medium none;padding:0px">
            <div><a href="https://unicode.org/reports/tr31/" target="_blank"><font face="arial, helvetica,
                  sans-serif">https://unicode.org/reports/tr31/</font></a></div>
          </blockquote>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><font face="arial, helvetica, sans-serif">Further, the
              tooling group was just talking about module names. I think
              we should allow any valid identifier name as module name,
              and look at how this could map to file names for a tooling
              TR&#39;s purpose.</font></div>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><font face="arial, helvetica, sans-serif">Thanks,</font></div>
          <div><font face="arial, helvetica, sans-serif"><br>
            </font></div>
          <div><span style="color:rgb(0,0,0);font-size:medium"><font face="arial, helvetica, sans-serif">JF</font></span><br>
          </div>
        </div>
      </div>
      <br>
      <fieldset class="gmail-m_-5950599726549270688mimeAttachmentHeader"></fieldset>
      <pre class="gmail-m_-5950599726549270688moz-quote-pre">_______________________________________________
SG16 Unicode mailing list
<a class="gmail-m_-5950599726549270688moz-txt-link-abbreviated" href="mailto:Unicode@isocpp.open-std.org" target="_blank">Unicode@isocpp.open-std.org</a>
<a class="gmail-m_-5950599726549270688moz-txt-link-freetext" href="http://www.open-std.org/mailman/listinfo/unicode" target="_blank">http://www.open-std.org/mailman/listinfo/unicode</a>
</pre>
    </blockquote>
    <p><br>
    </p>
  </div>

_______________________________________________<br>
SG16 Unicode mailing list<br>
<a href="mailto:Unicode@isocpp.open-std.org" target="_blank">Unicode@isocpp.open-std.org</a><br>
<a href="http://www.open-std.org/mailman/listinfo/unicode" rel="noreferrer" target="_blank">http://www.open-std.org/mailman/listinfo/unicode</a><br>
</blockquote></div>