]> gitweb.fperrin.net Git - atom.el.git/blob - xml-xhtml-entities.el
Use hex notation for entities
[atom.el.git] / xml-xhtml-entities.el
1 ;;; xml-xhtml-entities.el --- The XHTML entity set
2
3 ;; Copyright (C) 2011  Frédéric Perrin
4
5 ;; Author: Frédéric Perrin <frederic.perrin@resel.fr>
6 ;; Keywords: languages, data, hypermedia
7
8 ;; This program is free software; you can redistribute it and/or modify
9 ;; it under the terms of the GNU General Public License as published by
10 ;; the Free Software Foundation, either version 3 of the License, or
11 ;; (at your option) any later version.
12
13 ;; This program is distributed in the hope that it will be useful,
14 ;; but WITHOUT ANY WARRANTY; without even the implied warranty of
15 ;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 ;; GNU General Public License for more details.
17
18 ;; You should have received a copy of the GNU General Public License
19 ;; along with this program.  If not, see <http://www.gnu.org/licenses/>.
20
21 ;;; Commentary:
22
23 ;; This is the set of XHTML entities, as defined in
24 ;; <http://www.w3.org/TR/xhtml1/dtds.html#h-A2>. The document is
25 ;; provided with the following notice:
26
27 ;; Portions (C) International Organization for Standardization 1986
28 ;; Permission to copy in any form is granted for use with
29 ;; conforming SGML systems and applications as defined in
30 ;; ISO 8879, provided this notice is included in all copies.
31
32 ;;; Code:
33
34 (defconst xml-xhtml-entities
35 ;;; Latin-1 characters
36   '(("nbsp"     . " ") ;; no-break space = non-breaking space, U+00A0 ISOnum
37     ("iexcl"    . "¡") ;; inverted exclamation mark, U+00A1 ISOnum
38     ("cent"     . "¢") ;; cent sign, U+00A2 ISOnum
39     ("pound"    . "£") ;; pound sign, U+00A3 ISOnum
40     ("curren"   . "¤") ;; currency sign, U+00A4 ISOnum
41     ("yen"      . "¥") ;; yen sign = yuan sign, U+00A5 ISOnum
42     ("brvbar"   . "¦") ;; broken bar = broken vertical bar, U+00A6 ISOnum
43     ("sect"     . "§") ;; section sign, U+00A7 ISOnum
44     ("uml"      . "¨") ;; diaeresis = spacing diaeresis, U+00A8 ISOdia
45     ("copy"     . "©") ;; copyright sign, U+00A9 ISOnum
46     ("ordf"     . "ª") ;; feminine ordinal indicator, U+00AA ISOnum
47     ("laquo"    . "«") ;; left-pointing double angle quotation mark = left
48                        ;; pointing guillemet, U+00AB ISOnum
49     ("not"      . "¬") ;; not sign = angled dash, U+00AC ISOnum
50     ("shy"      . "­") ;; soft hyphen = discretionary hyphen, U+00AD ISOnum
51     ("reg"      . "®") ;; registered sign = registered trade mark sign, U+00AE
52                        ;; ISOnum
53     ("macr"     . "¯") ;; macron = spacing macron = overline = APL overbar,
54                        ;; U+00AF ISOdia
55     ("deg"      . "°") ;; degree sign, U+00B0 ISOnum
56     ("plusmn"   . "±") ;; plus-minus sign = plus-or-minus sign, U+00B1 ISOnum
57     ("sup2"     . "²") ;; superscript two = superscript digit two = squared,
58                        ;; U+00B2 ISOnum
59     ("sup3"     . "³") ;; superscript three = superscript digit three = cubed,
60                        ;; U+00B3 ISOnum
61     ("acute"    . "´") ;; acute accent = spacing acute, U+00B4 ISOdia
62     ("micro"    . "µ") ;; micro sign, U+00B5 ISOnum
63     ("para"     . "¶") ;; pilcrow sign = paragraph sign, U+00B6 ISOnum
64     ("middot"   . "·") ;; middle dot = Georgian comma = Greek middle dot,
65                        ;; U+00B7 ISOnum
66     ("cedil"    . "¸") ;; cedilla = spacing cedilla, U+00B8 ISOdia
67     ("sup1"     . "¹") ;; superscript one = superscript digit one, U+00B9 ISOnum
68     ("ordm"     . "º") ;; masculine ordinal indicator, U+00BA ISOnum
69     ("raquo"    . "»") ;; right-pointing double angle quotation mark = right
70                        ;; pointing guillemet, U+00BB ISOnum
71     ("frac14"   . "¼") ;; vulgar fraction one quarter = fraction one quarter,
72                        ;; U+00BC ISOnum
73     ("frac12"   . "½") ;; vulgar fraction one half = fraction one half, U+00BD
74                        ;; ISOnum
75     ("frac34"   . "¾") ;; vulgar fraction three quarters = fraction three
76                        ;; quarters, U+00BE ISOnum
77     ("iquest"   . "¿") ;; inverted question mark = turned question mark,
78                        ;; U+00BF ISOnum
79     ("Agrave"   . "À") ;; latin capital letter A with grave = latin capital
80                        ;; letter A grave, U+00C0 ISOlat1
81     ("Aacute"   . "Á") ;; latin capital letter A with acute, U+00C1 ISOlat1
82     ("Acirc"    . "Â") ;; latin capital letter A with circumflex, U+00C2 ISOlat1
83     ("Atilde"   . "Ã") ;; latin capital letter A with tilde, U+00C3 ISOlat1
84     ("Auml"     . "Ä") ;; latin capital letter A with diaeresis, U+00C4 ISOlat1
85     ("Aring"    . "Å") ;; latin capital letter A with ring above = latin
86                        ;; capital letter A ring, U+00C5 ISOlat1
87     ("AElig"    . "Æ") ;; latin capital letter AE = latin capital ligature AE,
88                        ;; U+00C6 ISOlat1
89     ("Ccedil"   . "Ç") ;; latin capital letter C with cedilla, U+00C7 ISOlat1
90     ("Egrave"   . "È") ;; latin capital letter E with grave, U+00C8 ISOlat1
91     ("Eacute"   . "É") ;; latin capital letter E with acute, U+00C9 ISOlat1
92     ("Ecirc"    . "Ê") ;; latin capital letter E with circumflex, U+00CA ISOlat1
93     ("Euml"     . "Ë") ;; latin capital letter E with diaeresis, U+00CB ISOlat1
94     ("Igrave"   . "Ì") ;; latin capital letter I with grave, U+00CC ISOlat1
95     ("Iacute"   . "Í") ;; latin capital letter I with acute, U+00CD ISOlat1
96     ("Icirc"    . "Î") ;; latin capital letter I with circumflex, U+00CE ISOlat1
97     ("Iuml"     . "Ï") ;; latin capital letter I with diaeresis, U+00CF ISOlat1
98     ("ETH"      . "Ð") ;; latin capital letter ETH, U+00D0 ISOlat1
99     ("Ntilde"   . "Ñ") ;; latin capital letter N with tilde, U+00D1 ISOlat1
100     ("Ograve"   . "Ò") ;; latin capital letter O with grave, U+00D2 ISOlat1
101     ("Oacute"   . "Ó") ;; latin capital letter O with acute, U+00D3 ISOlat1
102     ("Ocirc"    . "Ô") ;; latin capital letter O with circumflex, U+00D4 ISOlat1
103     ("Otilde"   . "Õ") ;; latin capital letter O with tilde, U+00D5 ISOlat1
104     ("Ouml"     . "Ö") ;; latin capital letter O with diaeresis, U+00D6 ISOlat1
105     ("times"    . "×") ;; multiplication sign, U+00D7 ISOnum
106     ("Oslash"   . "Ø") ;; latin capital letter O with stroke = latin capital
107                        ;; letter O slash, U+00D8 ISOlat1
108     ("Ugrave"   . "Ù") ;; latin capital letter U with grave, U+00D9 ISOlat1
109     ("Uacute"   . "Ú") ;; latin capital letter U with acute, U+00DA ISOlat1
110     ("Ucirc"    . "Û") ;; latin capital letter U with circumflex, U+00DB ISOlat1
111     ("Uuml"     . "Ü") ;; latin capital letter U with diaeresis, U+00DC ISOlat1
112     ("Yacute"   . "Ý") ;; latin capital letter Y with acute, U+00DD ISOlat1
113     ("THORN"    . "Þ") ;; latin capital letter THORN, U+00DE ISOlat1
114     ("szlig"    . "ß") ;; latin small letter sharp s = ess-zed, U+00DF ISOlat1
115     ("agrave"   . "à") ;; latin small letter a with grave = latin small letter
116                        ;; a grave, U+00E0 ISOlat1
117     ("aacute"   . "á") ;; latin small letter a with acute, U+00E1 ISOlat1
118     ("acirc"    . "â") ;; latin small letter a with circumflex, U+00E2 ISOlat1
119     ("atilde"   . "ã") ;; latin small letter a with tilde, U+00E3 ISOlat1
120     ("auml"     . "ä") ;; latin small letter a with diaeresis, U+00E4 ISOlat1
121     ("aring"    . "å") ;; latin small letter a with ring above = latin small
122                        ;; letter a ring, U+00E5 ISOlat1
123     ("aelig"    . "æ") ;; latin small letter ae = latin small ligature ae,
124                        ;; U+00E6 ISOlat1
125     ("ccedil"   . "ç") ;; latin small letter c with cedilla, U+00E7 ISOlat1
126     ("egrave"   . "è") ;; latin small letter e with grave, U+00E8 ISOlat1
127     ("eacute"   . "é") ;; latin small letter e with acute, U+00E9 ISOlat1
128     ("ecirc"    . "ê") ;; latin small letter e with circumflex, U+00EA ISOlat1
129     ("euml"     . "ë") ;; latin small letter e with diaeresis, U+00EB ISOlat1
130     ("igrave"   . "ì") ;; latin small letter i with grave, U+00EC ISOlat1
131     ("iacute"   . "í") ;; latin small letter i with acute, U+00ED ISOlat1
132     ("icirc"    . "î") ;; latin small letter i with circumflex, U+00EE ISOlat1
133     ("iuml"     . "ï") ;; latin small letter i with diaeresis, U+00EF ISOlat1
134     ("eth"      . "ð") ;; latin small letter eth, U+00F0 ISOlat1
135     ("ntilde"   . "ñ") ;; latin small letter n with tilde, U+00F1 ISOlat1
136     ("ograve"   . "ò") ;; latin small letter o with grave, U+00F2 ISOlat1
137     ("oacute"   . "ó") ;; latin small letter o with acute, U+00F3 ISOlat1
138     ("ocirc"    . "ô") ;; latin small letter o with circumflex, U+00F4 ISOlat1
139     ("otilde"   . "õ") ;; latin small letter o with tilde, U+00F5 ISOlat1
140     ("ouml"     . "ö") ;; latin small letter o with diaeresis, U+00F6 ISOlat1
141     ("divide"   . "÷") ;; division sign, U+00F7 ISOnum
142     ("oslash"   . "ø") ;; latin small letter o with stroke, = latin small
143                        ;; letter o slash, U+00F8 ISOlat1
144     ("ugrave"   . "ù") ;; latin small letter u with grave, U+00F9 ISOlat1
145     ("uacute"   . "ú") ;; latin small letter u with acute, U+00FA ISOlat1
146     ("ucirc"    . "û") ;; latin small letter u with circumflex, U+00FB ISOlat1
147     ("uuml"     . "ü") ;; latin small letter u with diaeresis, U+00FC ISOlat1
148     ("yacute"   . "ý") ;; latin small letter y with acute, U+00FD ISOlat1
149     ("thorn"    . "þ") ;; latin small letter thorn, U+00FE ISOlat1
150     ("yuml"     . "ÿ") ;; latin small letter y with diaeresis, U+00FF ISOlat1
151
152 ;;; Special characters for XHTML
153
154     ;; C0 Controls and Basic Latin
155     ("quot"     . "\"") ;; quotation mark, U+0022 ISOnum
156     ("amp"      . "&#x26;")  ;; ampersand, U+0026 ISOnum
157     ("lt"       . "&#x3c;")  ;; less-than sign, U+003C ISOnum
158     ("gt"       . "&#x3e;")  ;; greater-than sign, U+003E ISOnum
159     ("apos"     . "'")  ;; apostrophe = APL quote, U+0027 ISOnum
160
161     ;; Latin Extended-A
162     ("OElig"    . "Œ") ;; latin capital ligature OE, U+0152 ISOlat2
163     ("oelig"    . "œ") ;; latin small ligature oe, U+0153 ISOlat2
164                        ;; ligature is a misnomer, this is a separate character
165                        ;; in some languages
166     ("Scaron"   . "Š") ;; latin capital letter S with caron, U+0160 ISOlat2
167     ("scaron"   . "š") ;; latin small letter s with caron, U+0161 ISOlat2
168     ("Yuml"     . "Ÿ") ;; latin capital letter Y with diaeresis, U+0178 ISOlat2
169
170     ;; Spacing Modifier Letters
171     ("circ"     . "ˆ") ;;  modifier letter circumflex accent, U+02C6 ISOpub
172     ("tilde"    . "˜") ;;  small tilde, U+02DC ISOdia
173
174     ;; General Punctuation
175     ("ensp"     . " ") ;; en space, U+2002 ISOpub
176     ("emsp"     . " ") ;; em space, U+2003 ISOpub
177     ("thinsp"   . " ") ;; thin space, U+2009 ISOpub
178     ("zwnj"     . "‌") ;; zero width non-joiner, U+200C NEW RFC 2070
179     ("zwj"      . "‍") ;; zero width joiner, U+200D NEW RFC 2070
180     ("lrm"      . "‎") ;; left-to-right mark, U+200E NEW RFC 2070
181     ("rlm"      . "‏") ;; right-to-left mark, U+200F NEW RFC 2070
182     ("ndash"    . "–") ;; en dash, U+2013 ISOpub
183     ("mdash"    . "—") ;; em dash, U+2014 ISOpub
184     ("lsquo"    . "‘") ;; left single quotation mark, U+2018 ISOnum
185     ("rsquo"    . "’") ;; right single quotation mark, U+2019 ISOnum
186     ("sbquo"    . "‚") ;; single low-9 quotation mark, U+201A NEW
187     ("ldquo"    . "“") ;; left double quotation mark, U+201C ISOnum
188     ("rdquo"    . "”") ;; right double quotation mark, U+201D ISOnum
189     ("bdquo"    . "„") ;; double low-9 quotation mark, U+201E NEW
190     ("dagger"   . "†") ;; dagger, U+2020 ISOpub
191     ("Dagger"   . "‡") ;; double dagger, U+2021 ISOpub
192     ("permil"   . "‰") ;; per mille sign, U+2030 ISOtech
193     ("lsaquo"   . "‹") ;; single left-pointing angle quotation mark, U+2039
194                        ;; ISO proposed
195                        ;; lsaquo is proposed but not yet ISO standardized
196     ("rsaquo"   . "›") ;; single right-pointing angle quotation mark, U+203A
197                        ;; ISO proposed
198                        ;; rsaquo is proposed but not yet ISO standardized
199     ;; Currency Symbols
200     ("euro"     . "€") ;;  euro sign, U+20AC NEW
201
202 ;;; Mathematical, Greek and Symbolic characters for XHTML 
203
204     ;; Latin Extended-B
205     ("fnof"     . "ƒ") ;; latin small letter f with hook = function = florin,
206                        ;; U+0192 ISOtech
207
208     ;; Greek
209     ("Alpha"    . "Α") ;; greek capital letter alpha, U+0391
210     ("Beta"     . "Β") ;; greek capital letter beta, U+0392
211     ("Gamma"    . "Γ") ;; greek capital letter gamma, U+0393 ISOgrk3
212     ("Delta"    . "Δ") ;; greek capital letter delta, U+0394 ISOgrk3
213     ("Epsilon"  . "Ε") ;; greek capital letter epsilon, U+0395
214     ("Zeta"     . "Ζ") ;; greek capital letter zeta, U+0396
215     ("Eta"      . "Η") ;; greek capital letter eta, U+0397
216     ("Theta"    . "Θ") ;; greek capital letter theta, U+0398 ISOgrk3
217     ("Iota"     . "Ι") ;; greek capital letter iota, U+0399
218     ("Kappa"    . "Κ") ;; greek capital letter kappa, U+039A
219     ("Lambda"   . "Λ") ;; greek capital letter lamda, U+039B ISOgrk3
220     ("Mu"       . "Μ") ;; greek capital letter mu, U+039C
221     ("Nu"       . "Ν") ;; greek capital letter nu, U+039D
222     ("Xi"       . "Ξ") ;; greek capital letter xi, U+039E ISOgrk3
223     ("Omicron"  . "Ο") ;; greek capital letter omicron, U+039F
224     ("Pi"       . "Π") ;; greek capital letter pi, U+03A0 ISOgrk3
225     ("Rho"      . "Ρ") ;; greek capital letter rho, U+03A1
226     ;; there is no Sigmaf, and no U+03A2 character either
227     ("Sigma"    . "Σ") ;; greek capital letter sigma, U+03A3 ISOgrk3
228     ("Tau"      . "Τ") ;; greek capital letter tau, U+03A4
229     ("Upsilon"  . "Υ") ;; greek capital letter upsilon, U+03A5 ISOgrk3
230     ("Phi"      . "Φ") ;; greek capital letter phi, U+03A6 ISOgrk3
231     ("Chi"      . "Χ") ;; greek capital letter chi, U+03A7
232     ("Psi"      . "Ψ") ;; greek capital letter psi, U+03A8 ISOgrk3
233     ("Omega"    . "Ω") ;; greek capital letter omega, U+03A9 ISOgrk3
234
235     ("alpha"    . "α") ;; greek small letter alpha, U+03B1 ISOgrk3
236     ("beta"     . "β") ;; greek small letter beta, U+03B2 ISOgrk3
237     ("gamma"    . "γ") ;; greek small letter gamma, U+03B3 ISOgrk3
238     ("delta"    . "δ") ;; greek small letter delta, U+03B4 ISOgrk3
239     ("epsilon"  . "ε") ;; greek small letter epsilon, U+03B5 ISOgrk3
240     ("zeta"     . "ζ") ;; greek small letter zeta, U+03B6 ISOgrk3
241     ("eta"      . "η") ;; greek small letter eta, U+03B7 ISOgrk3
242     ("theta"    . "θ") ;; greek small letter theta, U+03B8 ISOgrk3
243     ("iota"     . "ι") ;; greek small letter iota, U+03B9 ISOgrk3
244     ("kappa"    . "κ") ;; greek small letter kappa, U+03BA ISOgrk3
245     ("lambda"   . "λ") ;; greek small letter lamda, U+03BB ISOgrk3
246     ("mu"       . "μ") ;; greek small letter mu, U+03BC ISOgrk3
247     ("nu"       . "ν") ;; greek small letter nu, U+03BD ISOgrk3
248     ("xi"       . "ξ") ;; greek small letter xi, U+03BE ISOgrk3
249     ("omicron"  . "ο") ;; greek small letter omicron, U+03BF NEW
250     ("pi"       . "π") ;; greek small letter pi, U+03C0 ISOgrk3
251     ("rho"      . "ρ") ;; greek small letter rho, U+03C1 ISOgrk3
252     ("sigmaf"   . "ς") ;; greek small letter final sigma, U+03C2 ISOgrk3
253     ("sigma"    . "σ") ;; greek small letter sigma, U+03C3 ISOgrk3
254     ("tau"      . "τ") ;; greek small letter tau, U+03C4 ISOgrk3
255     ("upsilon"  . "υ") ;; greek small letter upsilon, U+03C5 ISOgrk3
256     ("phi"      . "φ") ;; greek small letter phi, U+03C6 ISOgrk3
257     ("chi"      . "χ") ;; greek small letter chi, U+03C7 ISOgrk3
258     ("psi"      . "ψ") ;; greek small letter psi, U+03C8 ISOgrk3
259     ("omega"    . "ω") ;; greek small letter omega, U+03C9 ISOgrk3
260     ("thetasym" . "ϑ") ;; greek theta symbol, U+03D1 NEW
261     ("upsih"    . "ϒ") ;; greek upsilon with hook symbol, U+03D2 NEW
262     ("piv"      . "ϖ") ;; greek pi symbol, U+03D6 ISOgrk3
263
264     ;; General Punctuation
265     ("bull"     . "•") ;; bullet = black small circle, U+2022 ISOpub 
266     ;; bullet is NOT the same as bullet operator, U+2219
267     ("hellip"   . "…") ;; horizontal ellipsis = three dot leader, U+2026 ISOpub 
268     ("prime"    . "′") ;; prime = minutes = feet, U+2032 ISOtech
269     ("Prime"    . "″") ;; double prime = seconds = inches, U+2033 ISOtech
270     ("oline"    . "‾") ;; overline = spacing overscore, U+203E NEW
271     ("frasl"    . "⁄") ;; fraction slash, U+2044 NEW
272
273     ;; Letterlike Symbols
274     ("weierp"   . "℘") ;; script capital P = power set = Weierstrass p, U+2118
275                        ;; ISOamso
276     ("image"    . "ℑ") ;; black-letter capital I = imaginary part, U+2111
277                        ;; ISOamso
278     ("real"     . "ℜ") ;; black-letter capital R = real part symbol, U+211C
279                        ;; ISOamso
280     ("trade"    . "™") ;; trade mark sign, U+2122 ISOnum
281     ("alefsym"  . "ℵ") ;; alef symbol = first transfinite cardinal, U+2135 NEW
282     ;; alef symbol is NOT the same as hebrew letter alef, U+05D0 although the
283     ;; same glyph could be used to depict both characters
284
285     ;; Arrows
286     ("larr"     . "←") ;; leftwards arrow, U+2190 ISOnum
287     ("uarr"     . "↑") ;; upwards arrow, U+2191 ISOnum
288     ("rarr"     . "→") ;; rightwards arrow, U+2192 ISOnum
289     ("darr"     . "↓") ;; downwards arrow, U+2193 ISOnum
290     ("harr"     . "↔") ;; left right arrow, U+2194 ISOamsa
291     ("crarr"    . "↵") ;; downwards arrow with corner leftwards = carriage
292                        ;; return, U+21B5 NEW
293     ("lArr"     . "⇐") ;; leftwards double arrow, U+21D0 ISOtech
294     ;; Unicode does not say that lArr is the same as the 'is implied by' arrow
295     ;; but also does not have any other character for that function. So lArr
296     ;; can be used for 'is implied by' as ISOtech suggests
297     ("uArr"     . "⇑") ;; upwards double arrow, U+21D1 ISOamsa
298     ("rArr"     . "⇒") ;; rightwards double arrow, U+21D2 ISOtech
299     ;; Unicode does not say this is the 'implies' character but does not have
300     ;; another character with this function so rArr can be used for 'implies'
301     ;; as ISOtech suggests
302     ("dArr"     . "⇓") ;; downwards double arrow, U+21D3 ISOamsa
303     ("hArr"     . "⇔") ;; left right double arrow, U+21D4 ISOamsa
304
305     ;; Mathematical Operators
306     ("forall"   . "∀") ;; for all, U+2200 ISOtech
307     ("part"     . "∂") ;; partial differential, U+2202 ISOtech 
308     ("exist"    . "∃") ;; there exists, U+2203 ISOtech
309     ("empty"    . "∅") ;; empty set = null set, U+2205 ISOamso
310     ("nabla"    . "∇") ;; nabla = backward difference, U+2207 ISOtech
311     ("isin"     . "∈") ;; element of, U+2208 ISOtech
312     ("notin"    . "∉") ;; not an element of, U+2209 ISOtech
313     ("ni"       . "∋") ;; contains as member, U+220B ISOtech
314     ("prod"     . "∏") ;; n-ary product = product sign, U+220F ISOamsb
315     ;; prod is NOT the same character as U+03A0 'greek capital letter pi'
316     ;; though the same glyph might be used for both
317     ("sum"      . "∑") ;; n-ary summation, U+2211 ISOamsb
318     ;; sum is NOT the same character as U+03A3 'greek capital letter sigma'
319     ;; though the same glyph might be used for both
320     ("minus"    . "−") ;; minus sign, U+2212 ISOtech
321     ("lowast"   . "∗") ;; asterisk operator, U+2217 ISOtech
322     ("radic"    . "√") ;; square root = radical sign, U+221A ISOtech
323     ("prop"     . "∝") ;; proportional to, U+221D ISOtech
324     ("infin"    . "∞") ;; infinity, U+221E ISOtech
325     ("ang"      . "∠") ;; angle, U+2220 ISOamso
326     ("and"      . "∧") ;; logical and = wedge, U+2227 ISOtech
327     ("or"       . "∨") ;; logical or = vee, U+2228 ISOtech
328     ("cap"      . "∩") ;; intersection = cap, U+2229 ISOtech
329     ("cup"      . "∪") ;; union = cup, U+222A ISOtech
330     ("int"      . "∫") ;; integral, U+222B ISOtech
331     ("there4"   . "∴") ;; therefore, U+2234 ISOtech
332     ("sim"      . "∼") ;; tilde operator = varies with = similar to, U+223C
333                        ;; ISOtech
334     ;; tilde operator is NOT the same character as the tilde, U+007E, although
335     ;; the same glyph might be used to represent both
336     ("cong"     . "≅") ;; approximately equal to, U+2245 ISOtech
337     ("asymp"    . "≈") ;; almost equal to = asymptotic to, U+2248 ISOamsr
338     ("ne"       . "≠") ;; not equal to, U+2260 ISOtech
339     ("equiv"    . "≡") ;; identical to, U+2261 ISOtech
340     ("le"       . "≤") ;; less-than or equal to, U+2264 ISOtech
341     ("ge"       . "≥") ;; greater-than or equal to, U+2265 ISOtech
342     ("sub"      . "⊂") ;; subset of, U+2282 ISOtech
343     ("sup"      . "⊃") ;; superset of, U+2283 ISOtech
344     ("nsub"     . "⊄") ;; not a subset of, U+2284 ISOamsn
345     ("sube"     . "⊆") ;; subset of or equal to, U+2286 ISOtech
346     ("supe"     . "⊇") ;; superset of or equal to, U+2287 ISOtech
347     ("oplus"    . "⊕") ;; circled plus = direct sum, U+2295 ISOamsb
348     ("otimes"   . "⊗") ;; circled times = vector product, U+2297 ISOamsb
349     ("perp"     . "⊥") ;; up tack = orthogonal to = perpendicular, U+22A5
350                        ;; ISOtech
351     ("sdot"     . "⋅") ;; dot operator, U+22C5 ISOamsb
352     ;; dot operator is NOT the same character as U+00B7 middle dot
353
354     ;; Miscellaneous Technical
355     ("lceil"    . "⌈") ;; left ceiling = APL upstile, U+2308 ISOamsc 
356     ("rceil"    . "⌉") ;; right ceiling, U+2309 ISOamsc 
357     ("lfloor"   . "⌊") ;; left floor = APL downstile, U+230A ISOamsc 
358     ("rfloor"   . "⌋") ;; right floor, U+230B ISOamsc 
359     ("lang"     . "〈") ;; left-pointing angle bracket = bra, U+2329 ISOtech
360     ;; lang is NOT the same character as U+003C 'less than sign' or U+2039
361     ;; 'single left-pointing angle quotation mark'
362     ("rang"     . "〉") ;; right-pointing angle bracket = ket, U+232A ISOtech
363     ;; rang is NOT the same character as U+003E 'greater than sign' or U+203A
364     ;; 'single right-pointing angle quotation mark'
365
366     ;; Geometric Shapes
367     ("loz"      . "◊") ;; lozenge, U+25CA ISOpub
368
369     ;; Miscellaneous Symbols
370     ("spades"   . "♠") ;; black spade suit, U+2660 ISOpub
371     ;; black here seems to mean filled as opposed to hollow
372     ("clubs"    . "♣") ;; black club suit = shamrock, U+2663 ISOpub
373     ("hearts"   . "♥") ;; black heart suit = valentine, U+2665 ISOpub
374     ("diams"    . "♦")) ;; black diamond suit, U+2666 ISOpub
375   "The XHTML entities, in a format suitable for the `xml.el'
376 package.")
377
378 (provide 'xml-xhtml-entities)
379 ;;; xml-xhtml-entities.el ends here