﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>C++博客-心無雜念的空白-文章分类-字符编码</title><link>http://www.cppblog.com/lshain/category/17562.html</link><description>Beyond this world...</description><language>zh-cn</language><lastBuildDate>Thu, 02 Feb 2012 03:50:27 GMT</lastBuildDate><pubDate>Thu, 02 Feb 2012 03:50:27 GMT</pubDate><ttl>60</ttl><item><title>笨笨数据压缩教程（转）</title><link>http://www.cppblog.com/lshain/articles/164817.html</link><dc:creator>Lshain</dc:creator><author>Lshain</author><pubDate>Thu, 02 Feb 2012 02:14:00 GMT</pubDate><guid>http://www.cppblog.com/lshain/articles/164817.html</guid><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要: 第一章&nbsp;轻松一下：数据压缩简史&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;算起来，数据压缩的起源要比计机的起源早得多，有兴趣的读者可以翻阅一下任何一本成语辞典，查查诸如&#8220;二桃三士&#8221;、&#8220;萧规曹随&#8221;之类的短语涵盖了多少信息内容。　　认真一点：数据压缩技术在计算机技术的萌芽时期就已经被提上了议事日程，有关信息如何被高效存储...&nbsp;&nbsp;<a href='http://www.cppblog.com/lshain/articles/164817.html'>阅读全文</a><img src ="http://www.cppblog.com/lshain/aggbug/164817.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.cppblog.com/lshain/" target="_blank">Lshain</a> 2012-02-02 10:14 <a href="http://www.cppblog.com/lshain/articles/164817.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>unicode 编码表</title><link>http://www.cppblog.com/lshain/articles/153504.html</link><dc:creator>Lshain</dc:creator><author>Lshain</author><pubDate>Tue, 16 Aug 2011 00:46:00 GMT</pubDate><guid>http://www.cppblog.com/lshain/articles/153504.html</guid><description><![CDATA[<p>1.&nbsp; 【0020-007F】 Basic Latin 基本拉丁字母</p>
<p>2.&nbsp; 【00A0-00FF】 Latin-1 Supplement 拉丁字母补充-1</p>
<p>3.&nbsp; 【0100-017F】 Latin Extended-A 拉丁字母扩充-A</p>
<p>4.&nbsp; 【0180-023F】 Latin Extended-B 拉丁字母扩充-B</p>
<p>5.&nbsp; 【0250-02AF】 IPA Extensions 国际音标扩充</p>
<p><span id="more-704"></span></p>
<p>6.&nbsp; 【02B0-02EF】 Spacing Modifier Letters 进格修饰字符</p>
<p>7.&nbsp; 【0300-036F】 Combining Diacritical Marks 组合音标附加符号</p>
<p>8.&nbsp; 【0370-03FF】 Greek and Coptic 希腊字母</p>
<p>9.&nbsp; 【0400-04FF】 Cyrillic 西里尔字母</p>
<p>10. 【0500-052F】 Cyrillic Supplement 西里尔字母补充</p>
<p>11. 【0530-058F】 Armenian 亚美尼亚文</p>
<p>12. 【0590-05FF】 Hebrew 希伯来文</p>
<p>13. 【0600-06FF】 Arabic 基本阿拉伯文</p>
<p>14. 【0700-074F】 Syriac 叙利亚文</p>
<p>15. 【0750-077F】 Arabic Supplement 阿拉伯文补充</p>
<p>16. 【0780-07BF】 Thaana 塔纳文</p>
<p>17. 【07C0-07FF】 N&#8217;Ko&nbsp;</p>
<p>18. 【0900-097F】 Devanagari 天城体梵文字母</p>
<p>19. 【0980-09FF】 Bengali 孟加拉国文</p>
<p>20. 【0A00-0A7F】 Gurmukhi 古尔穆基文</p>
<p>21. 【0A80-0AFF】 Gujarati 古吉拉特文</p>
<p>22. 【0B00-0B7F】 Oriya 奥里亚文</p>
<p>23. 【0B80-0BFF】 Tamil 泰米尔文</p>
<p>24. 【0C00-0C7F】 Telugu 泰卢固文</p>
<p>25. 【0C80-0CFF】 Kannada 卡纳达文</p>
<p>26. 【0D00-0D7F】 Malayalam 马拉亚拉姆文</p>
<p>27. 【0D80-0DFF】 Sinhala 僧伽罗文</p>
<p>28. 【0E00-0E7F】 Thai 泰文</p>
<p>29. 【0E80-0EFF】 Lao 老挝文；寮国文</p>
<p>30. 【0F00-0FFF】 Tibetan 藏文</p>
<p>31. 【1000-109F】 Myanmar 缅甸文</p>
<p>32. 【10A0-10FF】 Georgian 格鲁吉亚文</p>
<p>33. 【1100-11FF】 Hangul Jamo 谚文字母</p>
<p>34. 【1200-137F】 Ethiopic 埃塞俄比亚文</p>
<p>35. 【1380-139F】 Ethiopic Supplement 埃塞俄比亚文补充</p>
<p>36. 【13A0-13FF】 Cherokee 切罗基文</p>
<p>37. 【1400-167F】 Unified Canadian Aboriginal Syllabics 加拿大土著统一音节文字</p>
<p>38. 【1680-169F】 Ogham 欧甘文</p>
<p>39. 【16A0-16FF】 Runic 北欧古文</p>
<p>40. 【1700-171F】 Tagalog 他加禄文</p>
<p>41. 【1720-173F】 Hanunoo 哈努诺文</p>
<p>42. 【1740-175F】 Buhid 布什德文</p>
<p>43. 【1760-177F】 Tagbanwa 塔格巴努亚文</p>
<p>44. 【1780-17FF】 Khmer 高棉文</p>
<p>45. 【1800-18AF】 Mongolian 蒙古文</p>
<p>46. 【1900-194F】 Limbu 林布文</p>
<p>47. 【1950-197F】 Tai Le 傣哪文；德宏傣文</p>
<p>48. 【1980-19DF】 New Tai Lue 新傣仂文</p>
<p>49. 【19E0-19FF】 Khmer Symbols 高棉符号</p>
<p>50. 【1A00-1A1F】 Buginese 布吉文</p>
<p>51. 【1B00-1B7F】 Balinese 巴利文</p>
<p>52. 【1D00-1D7F】 Phonetic Extensions 音标扩充</p>
<p>53. 【1D80-1DBF】 Phonetic Extensions Supplement 音标扩充补充</p>
<p>54. 【1DC0-1DFF】 Combining Diacritical Marks Supplement 组合音标附加符号</p>
<p>55. 【1E00-1EFF】 Latin Extended Additional 拉丁字母扩充附加</p>
<p>56. 【1F00-1FFF】 Greek Extended 希腊文扩充</p>
<p>57. 【2000-206F】 General Punctuation 一般标点符号</p>
<p>58. 【2070-209F】 Superscripts and Subscripts 下标及上标</p>
<p>59. 【20A0-20CF】 Currency Symbols 货币符号</p>
<p>60. 【20D0-20FF】 Combining Diacritical Marks for Symbols 符号用组合附加符号</p>
<p>61. 【2100-214F】 Letterlike Symbols 似字母符号</p>
<p>62. 【2150-218F】 Number Forms 数字形式</p>
<p>63. 【2190-21FF】 Arrows 箭头符号</p>
<p>64. 【2200-22FF】 Mathematical Operators 数学运算符号</p>
<p>65. 【2300-23FF】 Miscellaneous Technical 混合专门符号</p>
<p>66. 【2400-243F】 Control Pictures 控制图像</p>
<p>67. 【2440-245F】 Optical Character Recognition 光学字符识别</p>
<p>68. 【2460-24FF】 Enclosed Alphanumerics 括号字母数字</p>
<p>69. 【2500-257F】 Box Drawing 制表符</p>
<p>70. 【2580-259F】 Block Elements 区块组件</p>
<p>71. 【25A0-25FF】 Geometric Shapes 几何形状</p>
<p>72. 【2600-26FF】 Miscellaneous Symbols 混合什锦符号</p>
<p>73. 【2700-27BF】 Dingbats 什锦符号</p>
<p>74. 【27C0-27EF】 Miscellaneous Mathematical Symbols-A 混合数学符号-A</p>
<p>75. 【27F0-27FF】 Supplemental Arrows-A 补充性箭头符号-A</p>
<p>76. 【2800-28FF】 Braille Patterns 盲文；盲人点字</p>
<p>77. 【2900-297F】 Supplemental Arrows-B 补充性箭头符号-B</p>
<p>78. 【2980-29FF】 Miscellaneous Mathematical Symbols-B 混合数学符号-B</p>
<p>79. 【2A00-2AFF】 Supplemental Mathematical Operators 补充性数学运算符号</p>
<p>80. 【2B00-2BFF】 Miscellaneous Symbols and Arrows 混合什锦符号和箭头符号</p>
<p>81. 【2C00-2C5F】 Glagolitic 格拉戈尔字母</p>
<p>82. 【2C60-2C7F】 Latin Extended-C 拉丁字母扩充-C</p>
<p>83. 【2C80-2CFF】 Coptic 科普特文</p>
<p>84. 【2D00-2D2F】 Georgian Supplement 格鲁吉亚文补充</p>
<p>85. 【2D30-2D7F】 Tifinagh 提非纳格字母</p>
<p>86. 【2D80-2DDF】 Ethiopic Extended 埃塞俄比亚文扩充</p>
<p>87. 【2E00-2E7F】 Supplemental Punctuation 补充性标点符号</p>
<p>88. 【2E80-2EFF】 CJK Radicals Supplement 中日韩部首补充</p>
<p>89. 【2F00-2FDF】 Kangxi Radicals 康熙部首</p>
<p>90. 【2FF0-2FFF】 Ideographic Description Characters 汉字结构描述字符</p>
<p>91. 【3000-303F】 CJK Symbols and Punctuation 中日韩符号和标点</p>
<p>92. 【3040-309F】 Hiragana 平假名</p>
<p>93. 【30A0-30FF】 Katakana 片假名</p>
<p>94. 【3100-312F】 Bopomofo 注音符号</p>
<p>95. 【3130-318F】 Hangul Compatibility Jamo 谚文兼容字母</p>
<p>96. 【3190-319F】 Kanbun 汉文标注号</p>
<p>97. 【31A0-31BF】 Bopomofo Extended 注音符号扩充</p>
<p>98. 【31C0-31EF】 CJK Strokes 中日韩笔画部件</p>
<p>99. 【31F0-31FF】 Katakana Phonetic Extensions 片假名音标扩充</p>
<p>100.【3200-32FF】 Enclosed CJK Letters and Months 中日韩括号字母及月份</p>
<p>101.【3300-33FF】 CJK Compatibility 中日韩兼容字符</p>
<p>102.【3400-4DBF】 CJK Unified Ideographs Extension A 中日韩统一表意文字扩充A</p>
<p>103.【4DC0-4DFF】 Yijing Hexagram Symbols 易经六十四卦象</p>
<p>104.【4E00-9FFF】 CJK Unified Ideographs 中日韩统一表意文字</p>
<p>105.【A000-A48F】 Yi Syllables 彝文音节</p>
<p>106.【A490-A4CF】 Yi Radicals 彝文字母</p>
<p>107.【A700-A71F】 Modifier Tone Letters 声调符号</p>
<p>108.【A720-A7FF】 Latin Extended-D 拉丁字母扩充-D</p>
<p>109.【A800-A82F】 Syloti Nagri&nbsp;</p>
<p>110.【A840-A87F】 Phags-pa 八思巴字母</p>
<p>111.【AC00-D7AF】 Hangul Syllables 谚文音节</p>
<p>112.【D800-DB7F】 High Surrogates 高半代用区</p>
<p>113.【DB80-DBFF】 High Private Use Surrogates 高半专用代用区</p>
<p>114.【DC00-DFFF】 Low Surrogates 低半代用区</p>
<p>115.【E000-F8FF】 Private Use Area 专用区</p>
<p>116.【F900-FAFF】 CJK Compatibility Ideographs 中日韩兼容表意文字</p>
<p>117.【FB00-FB4F】 Alphabetic Presentation Forms 字母变体显现形式</p>
<p>118.【FB50-FDFF】 Arabic Presentation Forms-A 阿拉伯文变体显现形式-A</p>
<p>119.【FE00-FE0F】 Variation Selectors 字型变换选取器</p>
<p>120.【FE10-FE1F】 Vertical Forms 竖式标点</p>
<p>121.【FE20-FE2F】 Combining HalF】 Marks 组合半角标示</p>
<p>122.【FE30-FE4F】 CJK Compatibility Forms 中日韩相容形式</p>
<p>123.【FE50-FE6F】 Small Form Variants 小写变体</p>
<p>124.【FE70-FEFF】 Arabic Presentation Forms-B 阿拉伯文变体显现形式-B</p>
<p>125.【FF00-FFEF】 Halfwidth and Fullwidth Forms 半角及全角字符</p>
<p>126.【FFF0-FFFF】 Specials 特殊区域</p>
<p>127.【10000-1007F】 Linear B Syllabary 线形文字B音节文字</p>
<p>128.【10080-100FF】 Linear B Ideograms 线形文字B表意文字</p>
<p>129.【10100-1013F】 Aegean Numbers 爱琴数字</p>
<p>130.【10140-1018F】 Ancient Greek Numbers 古希腊数字</p>
<p>131.【10300-1032F】 Old Italic 古意大利文</p>
<p>132.【10330-1034F】 Gothic 哥特文</p>
<p>133.【10380-1039F】 Ugaritic 乌加里特楔形文字</p>
<p>134.【103A0-103DF】 Old Persian 古波斯文</p>
<p>135.【10400-1044F】 Deseret 犹他大学音标</p>
<p>136.【10450-1047F】 Shavian 肃伯纳字母</p>
<p>137.【10480-104AF】 Osmanya&nbsp;</p>
<p>138.【10800-1083F】 Cypriot Syllabary 塞浦路斯音节文字</p>
<p>139.【10900-1091F】 Phoenician 腓尼基字母</p>
<p>140.【10A00-10A5F】 Kharoshthi 佉卢字母</p>
<p>141.【12000-123FF】 Cuneiform 楔形文字</p>
<p>142.【12400-1247F】 Cuneiform Numbers and Punctuation 楔形文字数字及标点</p>
<p>143.【1D000-1D0FF】 Byzantine Musical Symbols 东正教音乐符号</p>
<p>144.【1D100-1D1FF】 Musical Symbols 音乐符号</p>
<p>145.【1D200-1D24F】 Ancient Greek Musical Notation 古希腊音乐谱记号</p>
<p>146.【1D300-1D35F】 Tai Xuan Jing Symbols 太玄经符号</p>
<p>147.【1D360-1D37F】 Counting Rod Numerals 算筹记数式</p>
<p>148.【1D400-1D7FF】 Mathematical Alphanumeric Symbols 数学用字母数字符号</p>
<p>149.【20000-2A6DF】 CJK Unified Ideographs Extension B 中日韩统一表意文字扩充B</p>
<p>150.【2F800-2FA1F】 CJK Compatibility Ideographs Supplement 中日韩兼容表意文字补充</p>
<p>151.【E0000-E007F】 Tags 语言编码卷标</p>
<p>152.【E0100-E01EF】 Variation Selectors Supplement 字型变换选取器补充</p>
<p>153.【FFF80-FFFFF】 Supplementary Private Use Area-A 补充专用区-A</p>
<p>154.【10FF80-10FFFF】 Supplementary Private Use Area-B 补充专用区-B</p> <img src ="http://www.cppblog.com/lshain/aggbug/153504.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.cppblog.com/lshain/" target="_blank">Lshain</a> 2011-08-16 08:46 <a href="http://www.cppblog.com/lshain/articles/153504.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>