1# *************************************************************************** 2# * 3# * Copyright (C) 2004-2015, International Business Machines 4# * Corporation; Unicode, Inc.; and others. All Rights Reserved. 5# * 6# *************************************************************************** 7# File: Latin_Katakana.txt 8# Generated from CLDR 9# 10:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ←-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ; 11:: [:Latin:] fullwidth-halfwidth (); 12:: NFD (NFC); 13:: Lower (); # whenever transliterating from cased to uncased script, include this 14$vowel = [aeiou] ; 15$consonant = [bcdfghjklmnpqrstvwxyz] ; 16$macron = \u0304 ; 17$kana = [ぁ-ゔ] ; 18$voice = [\u3099゛]; 19$semivoice = [\u309A゜]; 20$k_start = [カキクケコかきくけこ] ; 21$s_start = [サシスセソさしすせそ] ; 22$j_start = [シし] $voice ; 23$t_start = [タチツテトたちつてと] ; 24$n_start = [ナニヌネノンなにぬねの] ; 25$h_start = [ハヒヘホはひへほ] ; 26$f_start = [フふ] ; 27$m_start = [マミムメモまみむめも] ; 28$y_start = [ヤユヨやゆよ] ; 29$r_start = [ラリルレロらりるれろ] ; 30$w_start = [ワヰヱヲわゐゑを] ; 31$v_start = [ワヰヱヲ]\u3099 ; 32$voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ; 33$n_quoter = [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ; 34$small_y = [ャィュェョ] ; 35$iteration = ゝ ; 36'.' ↔ 。; 37',' ↔ 、; 38va ↔ ワ\u3099 ; 39vi ↔ ヰ\u3099 ; 40ve ↔ ヱ\u3099 ; 41vo ↔ ヲ\u3099 ; 42'~ka' ↔ ヵ ; 43'~ke' ↔ ヶ ; 44ya ← '~'ャ; 45yi ← '~'ィ ; 46yu ← '~'ュ; 47ye ← '~'ェ; 48yo ← '~'ョ; 49a ↔ ア ; 50b | '~' ← ヒ \u3099} $small_y ; 51by } $vowel → ヒ\u3099 | '~y' ; 52ba ↔ ハ\u3099 ; 53bi ↔ ヒ\u3099 ; 54bu ↔ フ\u3099 ; 55be ↔ ヘ\u3099 ; 56bo ↔ ホ\u3099 ; 57c } i → | s ; 58c } e → | s ; 59da ↔ タ\u3099 ; 60di ↔ テ\u3099ィ ; 61du ↔ テ\u3099ゥ ; 62de ↔ テ\u3099 ; 63do ↔ ト\u3099 ; 64dzu ↔ ツ\u3099 ; 65dja ← チ\u3099ャ ; 66dji'~i' ← チ\u3099ィ ; # liu 67dju ← チ\u3099ュ ; 68dje ← チ\u3099ェ ; 69djo ← チ\u3099ョ ; 70dji ↔ チ\u3099 ; 71dj } $vowel → チ\u3099 | '~y' ; 72cha ← チャ ; 73chi'~i' ← チィ ; # liu 74chu ← チュ ; 75che ← チェ ; 76cho ← チョ ; 77chi ↔ チ ; 78ch } $vowel → チ | '~y' ; 79e ↔ エ ; 80g | '~' ← キ\u3099} $small_y ; 81gy } $vowel → キ\u3099 | '~y' ; 82ga ↔ カ\u3099 ; 83gi ↔ キ\u3099 ; 84gu ↔ ク\u3099 ; 85ge ↔ ケ\u3099 ; 86go ↔ コ\u3099 ; 87i ↔ イ ; 88ja ↔ シ\u3099ャ ; 89ji'~i' ← シ\u3099ィ ; # liu 90ju ↔ シ\u3099ュ ; 91je ↔ シ\u3099ェ ; 92jo ↔ シ\u3099ョ ; 93ji ↔ シ\u3099 ; 94k | '~' ← キ} $small_y ; 95ky } $vowel → キ | '~y' ; 96ka ↔ カ ; 97ki ↔ キ ; 98ku ↔ ク ; 99ke ↔ ケ ; 100ko ↔ コ ; 101m | '~' ← ミ} $small_y ; 102my } $vowel → ミ | '~y' ; 103ma ↔ マ ; 104mi ↔ ミ ; 105mu ↔ ム ; 106me ↔ メ ; 107mo ↔ モ ; 108m } [pbfv] → ン ; 109n | '~' ← ニ } $small_y ; 110ny } $vowel → ニ | '~y' ; 111na ↔ ナ ; 112ni ↔ ニ ; 113nu ↔ ヌ ; 114ne ↔ ネ ; 115no ↔ ノ ; 116o ↔ オ ; 117p | '~' ← ヒ\u309A } $small_y ; 118py } $vowel → ヒ\u309A | '~y' ; 119pa ↔ ハ\u309A ; 120pi ↔ ヒ\u309A ; 121pu ↔ フ\u309A ; 122pe ↔ ヘ\u309A ; 123po ↔ ホ\u309A ; 124h | '~' ← ヒ } $small_y ; 125hy } $vowel → ヒ | '~y' ; 126ha ↔ ハ ; 127hi ↔ ヒ ; 128hu ↔ ヘゥ ; 129he ↔ ヘ ; 130ho ↔ ホ ; 131fa ↔ ファ ; 132fi ↔ フィ ; 133fe ↔ フェ ; 134fo ↔ フォ ; 135fu ↔ フ ; 136r | '~' ← リ } $small_y ; 137ry } $vowel → リ | '~y' ; 138ra ↔ ラ ; 139ri ↔ リ ; 140ru ↔ ル ; 141re ↔ レ ; 142ro ↔ ロ ; 143za ↔ サ\u3099 ; 144zi ↔ セ\u3099ィ ; 145zu ↔ ス\u3099 ; 146ze ↔ セ\u3099 ; 147zo ↔ ソ\u3099 ; 148sa ↔ サ ; 149si ↔ セィ ; 150su ↔ ス ; 151se ↔ セ ; 152so ↔ ソ ; 153sha ← シャ ; 154shi'~i' ← シィ ; # liu 155shu ← シュ ; 156she ← シェ ; 157sho ← ショ ; 158shi ↔ シ ; 159sh } $vowel → シ | '~y' ; 160ta ↔ タ ; 161ti ↔ ティ ; 162tu ↔ テゥ ; 163te ↔ テ ; 164to ↔ ト ; 165tsu ↔ ツ ; 166vu ↔ ウ\u3099 ; 167u ↔ ウ ; 168wa ↔ ワ ; 169wi ↔ ヰ ; 170wu → ウ ; 171we ↔ ヱ ; 172wo ↔ ヲ ; 173ya ↔ ヤ ; 174yi → イ ; 175yu ↔ ユ ; 176ye → エ ; 177yo ↔ ヨ ; 178s } sh → ッ ; 179t } ch → ッ ; 180j } j ↔ ッ } $j_start ; 181b } b ↔ ッ } [$h_start$f_start] $voice; 182d } d ↔ ッ } $t_start $voice; 183g } g ↔ ッ } $k_start $voice; 184p } p ↔ ッ } [$h_start$f_start] $semivoice; 185z } z ↔ ッ } $s_start $voice; 186v } v ↔ ッ } $v_start; 187k } k ↔ ッ } $k_start ; 188m } m ↔ ッ } $m_start ; 189n } n ↔ ッ } $n_start ; 190h } h ↔ ッ } $h_start ; 191f } f ↔ ッ } $f_start ; 192r } r ↔ ッ } $r_start ; 193t } t ↔ ッ } $t_start ; 194s } s ↔ ッ } $s_start ; 195w } w ↔ ッ } $w_start; 196y } y ↔ ッ } $y_start; 197x } x → ッ ; 198c } k → ッ ; 199c } c → ッ ; 200c } q → ッ ; 201l } l → ッ ; 202q } q → ッ ; 203$macron ↔ ー ; 204'~a' ↔ ァ ; 205'~i' ↔ ィ ; 206'~u' ↔ ゥ ; 207'~e' ↔ ェ ; 208'~o' ↔ ォ ; 209'~tsu' ↔ ッ ; 210'~wa' ↔ ヮ ; 211'~ya' ↔ ャ ; 212'~yi' → ィ ; 213'~yu' ↔ ュ ; 214'~ye' → ェ ; 215'~yo' ↔ ョ ; 216j $1 ← sh (y* $vowel) {ヽ$voice ; 217dj $1 ← ch (y* $vowel) {ヽ$voice ; 218dz $1 ← ts (y* $vowel) {ヽ$voice ; 219g $1 ← k (y* $vowel) {ヽ$voice ; 220z $1 ← s (y* $vowel) {ヽ$voice ; 221d $1 ← t (y* $vowel) {ヽ$voice ; 222h $1 ← b (y* $vowel) {ヽ$voice ; 223v $1 ← w (y* $vowel) {ヽ$voice ; 224sh $1 ← sh (y* $vowel) {ヽ$voice ; 225j $1 ← j (y* $vowel) {ヽ$voice ; 226ch $1 ← ch (y* $vowel) {ヽ$voice ; 227dj $1 ← dj(y* $vowel) {ヽ$voice ; 228ts $1 ← ts (y* $vowel) {ヽ$voice ; 229dz $1 ← dz (y* $vowel) {ヽ$voice ; 230$1 ← ($consonant y* $vowel) {ヽ$voice? ; 231$1 ← (.) {ヽ $voice? ; # otherwise repeat last character 232← ヽ $voice? ; # delete if no characters found 233$voweled_basekana [\u3099 \u309A]? { h → ー ; 234cy → セィ ; 235dy → テ\u3099ィ ; 236hy → ヒ ; 237sy → セィ ; 238ty → ティ ; 239zy → セ\u3099ィ ; 240h → ヘ ; 241ch → チ; 242sh → シ ; 243dz → ツ\u3099 ; 244dj → チ\u3099; 245b → フ\u3099 ; 246d → テ\u3099 ; 247g → ク\u3099 ; 248k → ク ; 249m → ム ; 250n'' ← ン } $n_quoter ; 251n ↔ ン ; 252p → フ\u309A ; 253r → ル ; 254s → ス ; 255t → テ ; 256y → イ ; 257z → ス\u3099 ; 258v → ウ\u3099 ; 259f → フ; 260j → シ\u3099; 261w → ウ; 262ß → | ss ; 263æ → | e ; 264ð → | d ; 265ø → | u ; 266þ → | th ; 267c → | k ; 268l → | r ; 269q → | k ; 270x → | ks ; 271'~' → ; # delete stray tildes between letters 272[:Katakana:] { '' } [:Latin:] → ; # delete stray quotes between letters 273:: NFC (NFD) ; 274:: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth); 275:: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ; 276