Lines Matching full:data

6 # RBBI Test Data
13 # <word> any following data is for word break testing
14 # <sent> any following data is for sentence break testing
15 # <line> any following data is for line break testing
16 # <char> any following data is for char break testing
18 # <data> ... </data> test data. May span multiple lines.
25 # In ICU4C, this test data is run by intltest, rbbi/RBBITest/TestExtended.
26 # In ICU4J, this test data is run by com.ibm.icu.dev.test.rbbi.RBBITestExtended
40 <data><0>ク<400>ライアン<400>ト<400>サーバー<400></data>
41 # <data><0>ク<400>ライアン<400>トサーバー<400></data>
48 <data>\
49 …, took this opportunity to call him to account for some abuses he had to lay to his charge.•</data>
53 <data>\
54 …, took this opportunity to call him to account for some abuses he had to lay to his charge.•</data>
59 <data>\
60 •Doctor with a D. •As in, Ph.D., you know.•</data>
65 <data>\
66 …, took this opportunity to call him to account for some abuses he had to lay to his charge.•</data>
71 <data>\
72 …, took this opportunity to call him to account for some abuses he had to lay to his charge.•</data>
86 <data>•a•b•c• •,•\u0666•</data> # Quick Test
87 <data>•\r•\r•\r\n•\r\n•\n•\r•</data> # don't break CR/LF
90 <data>•\u0003•\N{COMBINING GRAVE ACCENT}•\r•\N{COMBINING GRAVE ACCENT}•</data>
91 <data>•\u0085•\N{COMBINING MACRON}•A\N{COMBINING MACRON}•</data>
94 <data>•\U00011000•\U00010020•\U00010000\N{COMBINING MACRON}•</data>
95 <data>•\ud800\udc00•\udbff\udfff•a•</data>
98 <data>•A\N{COMBINING GRAVE ACCENT}•B•</data>
99 <data>•\N{GREEK SMALL LETTER MU}\N{COMBINING LOW LINE}\N{COMBINING HORN}•</data>
100 <data>•a\u0301•b\u0302•c\u0303•d\u0304•e\u0305•f\u0306•g\u0307•h\u0308•i\u0309•</data>
102data>•a\u0301\u0302\u0303\u0304\u0301\u0302\u0303\u0304\u0301\u0302\u0303\u0304\u0301\u0302\u0303\…
111 <data>•\u1100\u1161\u11a8•\u1100\u1161\u11a8•</data> #LVT
112 <data>•\u1100\u1161•\u1100\u1161•</data>
113 <data>•\u1100\u1161\u11a8•\u1161•\u1100•\u11a8•\u1161\u1161\u1161\u11a8•</data>
114 <data>•\u1100\u1100\uac01•\u1100\uac01•\u1100\uac01\u0301•\uac01•</data>
115 <data>•\u1100\u0301•\u1161\u11a8\u0301•\u11a8•</data>
121 #<data>•भ••ा•\u0930•\u0924• •\u0938\u0941\u0902•\u0926•\u0930•
122 #•\u0939•\u094c•\u0964•</data>
123 #<data>•\u0916\u0947•\u0938\u0941\u0902•\u0926•\u0930•\u0939•\u094c•\u0964•</data>
127 <data>•\u0baa\u0bc1•\u0baa\u0bc1•</data>
130 <data>•\u0f40\u0f7d•\u0000•\u0f7e•</data>
135 <data>•\uffff•\uffff• •a•</data>
138 <data>•A\uff9e•B\uff9f\uff9e\uff9f•C•</data>
150 #<data>•a•b•c•</data>
151 #<data>•a\u0301\u0302• •b\u0303\u0304•</data>
154 #<data>•\u0904\u0903• •\u0937\u093E• •\u0904\u093F• •\u0937\u0940• •\u0937\u0949• •\u0937\u094A• •\…
159 #<data>•\u0e40\u0e01•\u0e44\u0301\u0e23\u0302\u0303•\u0e40•\u0e40\u0e02•\u0e02• •</data>
174 <data>•hello<200> •there<200> •goodbye<200></data>
175 <data>•hello<200> •12345<100> •,•</data>
179 # Test data originally in RBBIAPITest::TestFirstNextFollowing() and TestLastPreviousPreceding()
183 <data>•This<200> •is<200> •a<200> •word<200> •break<200>.• • •Isn't<200> •it<200>?• •2.25<100></dat…
188 # Data originally from TestDefaultRuleBasedWordIteration()
190 <data>•Write<200> •wordrules<200>.• •123.456<100> •alpha\u00adbeta\u00adgamma<200> •\u092f\u0939<20…
191 <data>• •\u0939\u093f\u0928\u094d\u200d\u0926\u0940<200> •\u0939\u0948<200> •\u0905\u093e\u092a<200…
194data>• •\u0968\u0966.\u0969\u096f<100> •\u0967\u0966\u0966.\u0966\u0966<100> •\N{RUPEE SIGN}•\u096…
196 <data>•\u0938\u094d\u200d\u0935\u0924\u0902deadTA\u0930<200>\r•It's<200> •$•30.10<100> •12,34<100>¢…
198data>•Badges<200>?• •BADGES<200>!•?•!• •We<200> •don't<200> •need<200> •no<200> •STINKING<200> •BA…
201data>•\uc5f0\ud569<200> •\uc7a5\ub85c\uad50\ud68c<200> •\u1109\u1161\u11bc\u1112\u1161\u11bc<200> …
203data>•Hello<200>,• •how<200> •are<200> •you<200> •\uc5f0\ud569<200> •\uc7a5\ub85c\uad50\ud68c<200>…
206data>•abc\U00010300<200> •abc\N{DESERET SMALL LETTER ENG}<200> •abc\N{MATHEMATICAL BOLD SMALL Z}<2…
209 <data>•abc<200>\U0001D800•def<200>\U0001D3FF• •</data>
213data>•abc<200>\N{HIRAGANA LETTER SMALL A}<400>\N{HIRAGANA LETTER VU}\N{COMBINING ACUTE ACCENT}<400…
216 <data>•芽キャベツ<400>芽キャベツ<400></data>
221 #<data>•どー<400>せ<400>日本語<400>を<400>勉強<400>する<400>理由<400>について<400> •て<400>こと<400>は<400>我<400>でも<400>…
222 <data>•日本語<400>を<400>勉強<400>する<400>理由<400>について<400> •て<400>こと<400>は<400>我<400>でも<400>知<400>ら<400>も<…
225 <data>•中だるみ<400>蔵王の森<400>ウ離島<400></data>
228data>•400<100>余<400>名<400>中央<400>委员<400>和<400>中央<400>候补<400>委员<400>都<400>领<400>到了<400>“•推荐<400>票<4…
231 <data>•def\N{COMBINING ACUTE ACCENT}\N{SYRIAC ABBREVIATION MARK}ghi<200> •</data>
234 <data>•aa\N{COMBINING GRAVE ACCENT}a<200> •</data>
237 # <data>•ISN'T<200> •19<100>日<400></data>
246data>•\uc0c1\ud56d<200> •\ud55c\uc778<200> •\uc5f0\ud569<200> •\uc7a5\ub85c\uad50\ud68c<200> •\u11…
250 #<data>•\ud55c\uad6d<200>\ub300\ud559\uad50<200>\uc790\uc5f0<200>\uacfc\ud559<200>\ub300\ud559<200>…
251data>•\ud604\uc7ac<200>\ub294<200> •\uac80\ucc30<200>\uc774<200> •\ubd84\uc2dd<200>\ud68c\uacc4<20…
253 <data>•abc<200>\u4e01<400>\u4e02<400>\u3005<400>\u4e03\u4e03<400>abc<200> •</data>
255 <data>•\u06c9<200>\uc799\ufffa•</data>
265 <data>•ΑΒΓ<200> •БВГ<200> •אבג֓<200> •ابت<200> •١٢٣<100> •\u10A0\u10A1\u10A2<200> •ABC<200> •</data>
267 <data>•\u0301•A<200></data>
274 # this test data. The current RBBI rules do not special case Hindi in
275 # any way, making this test data much less signfificant.
277 <data>•\u0917\u092a\u00ad\u0936\u092a<200>!•\u092f\u0939<200> •\u0939\u093f\u0928\u094d\u200d\u0926…
278 …0> •\u0905\u092e\u091c<200>\n•\u0938\u094d\u200d\u0935\u0924\u0902\u0924\u094d\u0930<200>\r•</data>
283 <data>•\u8527<400>\u02ba<200>\u0027\u0d42•\u00b7•\u09ea<100></data>
288 <data>•A\uff9e\uff9fBC<200> •1\uff9e\uff9f23<100></data>
291 <data>•Parlez<200>-•vous<200> •français<200> •?•</data>
295 <data>•ジョージア<400> •</data>
299 <data>•アレルギー性<400>結膜炎<400></data>
300 <data>•アテ<400>ローム<400>性<400>動脈硬化<400></data>
305 <data>•栃木<400>県<400>足利<400>市<400>で<400>の<400>撮影<400>が<400>公開<400></data>
306 <data>•栃木<400>県<400>足利<400>市<400>で<400>の<400>撮影<400>が<400>公開<400>さ<400>れ<400>た<400></data>
314 <data>•ロ<400>から<400>売却<400>完了<400>時<400>の<400>時価<400>が<400>提示<400>さ<400>れ<400>て<400>いる<400></data>
315 <data>•\U00011700<200>ロ<400>から<400>売却<400>完了<400>時<400>の<400>時価<400>が<400>提示<400>さ<400>れ<400>て<400>…
323 <data><0>ユニ<400>コード<400>と<400>は<400>何<400>か<400>?<0></data>
324 <data><0>ユニ<400>コード<400>は<400>、<0>すべて<400>の<400>文字<400>に<400>固有<400>の<400>番号<400>を<400>付与<400>し<400…
325 <data><0>プラットフォーム<400>に<400>は<400>依存<400>しま<400>せん<400></data>
326 <data><0>プログラム<400>に<400>も<400>依存<400>しま<400>せん<400></data>
327 <data><0>言語<400>に<400>も<400>依存<400>しま<400>せん<400></data>
329 <data><0>コンピューター<400>は<400>、<0>本質<400>的<400>に<400>は<400>数字<400>しか<400>扱う<400>こと<400>が<400>でき<400>ま<…
337 技術<400>的<400>な<400>記号<400>など<400>を<400>扱う<400>に<400>は<400>不十分<400>で<400>した<400>。<0></data>
339 <data><0>これらの<400>符号<400>化<400>の<400>仕組み<400>は<400>、<0>相互<400>に<400>矛盾<400>する<400>もの<400>でも<400>ありま…
345 乱れる<400>か<400>分<400>から<400>ない<400>危険<400>を<400>冒す<400>こと<400>の<400>なる<400>の<400>です<400>。<0></data>
347 <data><0>ユニ<400>コード<400>は<400>すべて<400>を<400>変<400>え<400>ます<400></data>
349 <data><0>ユニ<400>コード<400>は<400>、<0>プラットフォーム<400>に<400>係<400>わら<400>ず<400>、<0>プログラム<400>に<400>係<400>わ…
356 、<0>ISO<200>/<0>IEC<200></data>
357 <data><0> <0>10646<100>に<400>適合<400>する<400>ことに<400>なり<400>ます<400>。<0>ユニ<400>コード<400>は<400>、<0>多く<40…
361 流れ<400>に対して<400>、<0>特に<400>役<400>に<400>立<400>って<400>い<400>ます<400>。<0></data>
363 <data><0>ユニ<400>コード<400>を<400>ク<400>ライアン<400>ト<400>サーバー<400>型<400>の<400>アプリケーション<400>や<400>、<0>多層<4…
369 …0>乱れ<400>も<400>なし<400>に<400>転送<400>する<400>こと<400>を<400>可能<400>と<400>する<400>の<400>です<400>。<0></data>
371 <data><0>ユニ<400>コード<400>コンソーシアム<400>について<400></data>
373 <data><0>ユニ<400>コード<400>コンソーシアム<400>は<400>、<0>最新<400>の<400>ソフトウエア<400>製品<400>と<400>標準<400>において<400>…
380 コンソーシアム<400>の<400>会員<400>なる<400>こと<400>が<400>でき<400>ます<400>。<0></data>
382 <data><0>より<400>詳しい<400>こと<400>を<400>お<400>知<400>り<400>に<400>なり<400>たい<400>方<400>は<400>、<0>Glossary…
383 …ction<200> <0>および<400> <0>Useful<200> <0>Resources<200>を<400>ご<400>参照<400>くだ<400>さい<400>。<0></data>
396 # Test data originally from RBBI RBBITest::TestDefaultRuleBasedSentenceIteration()
402 <data>•This\n<100></data>
403 <data>•Hello! •how are you? •I'am fine. •Thankyou. •How are you \
404 doing? •This\n<100> costs $20,00,000. •</data>
408 <data>•"Sentence ending with a quote." •Bye.•</data>
410 # Sentence, and test data, ending without a period or other terminator.
411 <data>•Here is a random sentence, no ending period<100></data>
414 <data>• (This is it). •Testing the sentence iterator. •\
419 •Not on my time (el timo.)! •</data>
421 <data>•Hello. •So what!!\u2029•"But now," he said, \
431 •Now\r<100>is\n<100>the\r\n<100>time\n<100>\r<100>for\r<100>\r<100></data>
433 <data>•No breaks when . is surrounded by UPPER.Case letters. •</data>
434 <data>•No breaks when . is followed by Numeric .4 a.4 C.4 3.1 .•</data>
435 <data>•No breaks when . is followed by a lower, with possible intervening punct .,a .$a .)a. •</dat…
440data>•\u5487\u67ff\ue591\u5017\u61b3\u60a1\u9510\u8165:"JAVA\u821c\u8165\u7fc8\u51ce\u306d,\u2494\…
446 <data>•I know I'm right\uff0e •Right\uff1f •Right\uff01 •</data>
452data>•\u5487\u67ff\ue591\u5017\u61b3\u60a1\u9510\u8165\u9de8\u97e48888\u821c\u8165\u7fc8\u51ce\u30…
457 <data>•How do you do?(•Fine). •</data>
458 <data>•How do you do? •(Fine). •</data>
459 <data>•How do you do?(•fine). •</data>
460 <data>•How do you do? •(fine). •</data>
463 <data>•Hello.123<100></data> # Rule 6
464 <data>•Hello?•123<100></data>
466 <data>•HELLO.Bye<100></data> # Rule 7
467 <data>•HELLO?•Bye<100></data>
469 <data>•Hello.goodbye<100></data> #Rule 8
470 <data>•Hello. •Goodbye<100></data>
471 <data>•Hello. goodbye<100></data>
478data>•\<P>Provides a set of &quot;lightweight&quot; (all-java\<FONT SIZE="-2">\<SUP>TM\</SUP>\</FO…
479 <data>•Another test.\u2029•</data>
484 <data>•Today is the 27th of May, 1998. •</data>
485 <data>•Tomorrow with be 28 May 1998. •</data>
486 <data>•The day after will be the 30th.\u2029•</data>
491data>•The type of all primitive \<code>boolean\</code> values accessed in the target VM. •Calls t…
497 <data>•Constructs a randomly generated BigInteger, uniformly distributed over the range \<tt>0\</tt…
498 •</data>
504 <data>•\u0928\u092e\u0938\u094d\u200d\u0924\u0947 \u0930\u092e\u0947\u0936\u0905\u093e\u092a\u0915\…
506 …0902\u0924\u094d\u0930 \u0926\u093f\u0935\u093e\u0938) \u0939\u0948\u0964 •Let's end here. •</data>
510 <data>\
511 …0644\u0645\u062d\u0627\u0631\u0641\u0020\u0627\u0644\u0636\u0631\u0648\u0631\u064a\u0629. •</data>
514 <data>•Hello, world\u3002 •Hello, world\u1803 •Hello, world\u2048 •Hello, world\u203c •Let's end he…
563 <data>• •\u00A1•</data>
564 <data>• •\u0041•</data>
565 <data>• •\u0009•</data>
566 <data>• •\u00B4•</data>
567 <data>• \u000C<100></data> # LB3C × BK
568 <data>• •\u2014•</data>
569 <data>• •\uFFFC•</data>
570 <data>• \u0029•</data> # LB 8 × CL
571 # <data>• • \u0301•</data> # LB 7a Treat SP CM* as if it were ID #TODO: SP CM
572 <data>• \u0021•</data> # LB 8 × EX
573 #<data>• \u00A0•</data> # LB 11b × GL TODO: fix.
574 <data>• •\u002D•</data>
575 <data>• •\u4E00•</data>
576 <data>• •\u2024•</data>
577 <data>• \u002C•</data> # LB 8 × IS
578 <data>• \u000A<100></data> # LB3C × ( BK | CR | LF | NL )
579 <data>• •\u0E5A•</data>
580 <data>• •\u0032•</data>
581 <data>• •\u0028•</data>
582 <data>• •\u0025•</data>
583 <data>• •\u0024•</data>
584 <data>• •\u0022•</data>
585 <data>• •\u0E01•</data>
586 <data>• •\uDB7F•</data>
587 <data>• \u0020•</data> # LB4 - don't break before space.
588 <data>• \u002F•</data> # LB 8 × SY
589 <data>• •\uF8FF•</data>
590 <data>• \u200B•</data> # LB4 - don't break before ZA
596 <data>• •\u00A1\u2028<100>\u00A1•</data>
597 <data>• •\u0041\u2028<100>\u0041•</data>
598 <data>• •\u0009\u2028<100>\u0009•</data>
599 <data>• •\u00B4\u2028<100>\u00B4•</data>
600 <data>• \u000C<100>\u2028<100>\u000C<100></data>
601 <data>• •\u2014\u2028<100>\u2014•</data>
602 <data>• •\uFFFC\u2028<100>\uFFFC•</data>
603 <data>• \u0029\u2028<100>\u0029•</data>
604 #<data>• \u0301\u2028<100>\u0301•</data> # TODO: fix.
605 <data>• \u0021\u2028<100>\u0021•</data>
606 #<data>• \u00A0\u2028<100>\u00A0•</data> # TODO: fix
607 <data>• •\u002D\u2028<100>\u002D•</data>
608 <data>• •\u4E00\u2028<100>\u4E00•</data>
609 <data>• •\u2024\u2028<100>\u2024•</data>
610 <data>• \u002C\u2028<100>\u002C•</data>
611 <data>• \u000A<100>\u2028<100>\u000A<100></data>
612 <data>• •\u0E5A\u2028<100>\u0E5A•</data>
613 <data>• •\u0032\u2028<100>\u0032•</data>
614 <data>• •\u0028\u2028<100>\u0028•</data>
615 <data>• •\u0025\u2028<100>\u0025•</data>
616 <data>• •\u0024\u2028<100>\u0024•</data>
617 <data>• •\u0022\u2028<100>\u0022•</data>
618 <data>• •\u0E01\u2028<100>\u0E01•</data>
619 <data>• •\uDB7F\u2028<100>\uDB7F•</data>
620 <data>• \u0020\u2028<100>\u0020•</data>
621 <data>• \u002F\u2028<100>\u002F•</data>
622 <data>• •\uF8FF\u2028<100>\uF8FF•</data>
623 <data>• \u200B\u2028<100>\u200B•</data>
628 <data>•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•</data>
629 <data>•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0001F1…
631 <data>•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6\u00a0\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•</d…
632 <data>•\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6\u00a0\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0…
633 <data>•\U0001F1E6\U0001F1E6•\U0001F1E6\u00a0\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•</data>
634 <data>•\U0001F1E6\U0001F1E6•\U0001F1E6\u00a0\U0001F1E6\U0001F1E6•\U0001F1E6\U0001F1E6•\U0001F1E6•</
639 <data>•Parlez-•vous •français ?•</data>
642 # Old Line Break Test data. Orginally located in RBBITest::TestDefaultRuleBasedLineIteration()
647 <data>•Multi-•Level •example •of •a •semi-•idiotic •non-•sensical •(non-•important) •sentence.
648 …8<100>fine.\t•good. •Now\r<100>is\n<100>the\r\n<100>time\n<100>\r<100>for\r<100>\r<100>all•</data>
651 <data>•Hello! •how\r\n<100> •(are)\r<100> •you? •I'am •fine- •Thankyou. •foo\u00a0bar
652 <100>How, •are, •you? •This, •costs •$20,00,000.•</data>
656 <data>•\u96f6•\u4e00\u3002•\u4e8c\u3001•\u4e09\u3002\u3001•\u56db\u3001\u3002\u3001•\u4e94,•\u516d.…
659 <data>•foo\u00a0bar•</data>
662 <data>•dog,cat,mouse •(one)•(two)\n<100></data>
665 <data>•The •balance •is •$-23,456.78, •not •-•$32,456.78!\n<100></data>
675 <data>•\uc0c1•\ud56d •\ud55c•\uc778 •\uc5f0•\ud569 •\uc7a5•\ub85c•\uad50•\ud68c•</data>
678data>•\u1109\u1161\u11bc•\u1112\u1161\u11bc •\u1112\u1161\u11ab•\u110b\u1175\u11ab •\u110b\u1167\u…
681 <data>•\u4e01\uff0e•\u4e02\uff01•\u4e03\uff1f•</data>
685 <data>•\u4e01•\ud840\udc01•\u4e02•abc •\ue000 •\udb80\udc01•</data> #This line and the following a…
686 <data>•\u4e01•\U00020001•\u4e02•abc •\ue000 •\U000f0001•</data>
691 <data>•AAA(AAA •</data>
696 <data>•ΑΒΓ •БВГ •אבג֓ •ابت •١٢٣ •\u10A0\u10A1\u10A2 •ABC •</data>
701 <data>•abc\ud801xyz•</data>
708 <data>•\ufffc•\u30e3\u000c<100>\u1b39\u300a\u002f\u203a\u200b•\ufffc•\uaf64•\udcfb•</data>
709 <data>•\u114d\u31f3•\ube44\u002d•\u0362\u24e2\u276e\u2014\u205f\ufe16•\uc877•\u0fd0\u000a<100>\u20a…
710 <data>•\u080a\u215b\U0001d7d3\u002c•\u2025\U000e012e•\u02df\u118d\u0029\ua8d6\u0085<100>\u6cc4\u202…
714 <data>•abc/•s •def•</data>
715 <data>•abc/\u05D9 •def•</data>
716 <data>•\u05E7\u05D7/\u05D9 •\u05DE\u05E2\u05D9\u05DC•</data>
717 <data>•\u05D3\u05E8\u05D5\u05E9\u05D9\u05DD •\u05E9\u05D7\u05E7\u05E0\u05D9\u05DD/\u05D9\u05D5\u05E…
722 <data>•R$ •JP¥ •a9 •3a •H% •CA$ •Travi$ •Scott •Ke$ha •Curren$y •A$AP •Rocky•</data>
734 <data>•Here •is •a •short •sample •sentence. •And •another.•</data>
735 <data>•HERE •IS •A •SHORT •SAMPLE •SENTENCE. •AND •ANOTHER.•</data>
736 <data>• •Start •and •end •with •spaces •</data>
737 <data>•Include 123 456 ^& •some 54332 •numbers 4445•abc123•abc •ending 1223 •</data>
739 <data>•Combining\u0301 \u0301•ma\u0306rks •bye •</data>
740 <data>•123 •Start •with •a •number.•</data>
742 <data>•'•start •with •a •case-•ignorable •cha'r'a'cter•</data>
743 <data>•' '' •start •with •case-•ignorable & •case-•insensitive •cha'r'a'cter•</data>
744 <data>• ''•aaa' •bbb '•ccc' '•ddd''' '''•eee '''•fff''' •ggg ''•</data>
755 # Test data originally from the test code source file
756 # // @suwit -- Thai sample data from GVT Guideline
758 <data>•\u0E2B\u0E19\u0E36\u0E48\u0E07<200>\u0E04\u0E33<200>\u0E44\u0E17\u0E22<200>\
761 \u0e1e\u0e22\u0e32\u0e07\u0e04\u0e4c<200></data>
763 # Test data originally from http://bugs.icu-project.org/trac/search?q=r30327
764 <data>•กู<200> •กิน<200>กุ้ง<200> •ปิ้่<200>งอ<200>ยู่<200>ใน<200>ถ้ำ<200></data>
766 <data>•\u0E01\u0E39<200>\u0020•\u0E01\u0E34\u0E19<200>\u0E01\u0E38\u0E49\u0E07<200>\
768 \u0E43\u0E19<200>\u0E16\u0E49\u0E33<200></data>
771 <data>•0E01\u0E39\u0020•\u0E01\u0E34\u0E19•\u0E01\u0E38\u0E49\u0E07\
773 \u0E43\u0E19•\u0E16\u0E49\u0E33•</data>
775 # Data originally from intltest RBBITest::TestThaiLineBreak()
786 <data>•\u0e2a\u0e16\u0e32\u0e19\u0e35\u0e2f•\
799 \u0e19\u0e31\u0e49\u0e19•</data>
801 # Data originally from RBBITest::TestMixedThaiLineBreak()
805 <data>•\u0E1B\u0E35•\
820 Bangkok)•</data>
822 # Data originally from RBBITest::TestMaiyamok()
828 <data>•\u0e44\u0e1b\u0e46•\
836 \u0e43\u0e2b\u0e21\u0e48•</data>
840 <data>•ใช•มั้ย•</data>
841 <data>•มั๊ยล่ะ•ที่รัก•</data>
845 <data>•เล่น•ผ่าน•ทาง•บลูทูธ•บน•อุปกรณ์•</data>
849 <data>•ไป•ที่•ซานฟรานซิสโก•</data>
853 <data>•แท็ก•แอปพลิเคชัน•เป็น•พิเศษ•</data>
857 <data>•เบ•เบราว์เซอร์•โพ•โพสต์•โพสท์•</data>
861 <data>•อัปเดต•อีเวนต์•</data>
871 <data>•ສະບາຍດີ•</data>
872 <data>•ດີ•ຂອບໃຈ•</data>
873 <data>•ເຈົ້າ•ເວົ້າ•ພາສາ•ອັງກິດ•ໄດ້•ບໍ່•</data>
874 <data>•ກະລຸນາ•ເວົ້າ•ຊ້າ•ໆ•</data>
884 <data>•လူ•တိုင်း•သည် •တူညီ •လွတ်လပ်•သော •ဂုဏ်•သိ•က္•ခါ•ဖြ•င့် •လည်းကောင်း၊ •</data>
885 <data>•တူညီ•လွတ်လပ်•သော •အ•ခွ•င့်•အရေး•များ•ဖြ•င့် •လည်းကောင်း၊ •မွေး•ဖွား•လာ•သူများ •ဖြစ်သည်။•</da…
886 <data>•ထို•သူ•တို့၌ •ပိုင်းခြား •ဝေဖန်•တတ်•သော •ဉာဏ်•နှ•င့် •ကျ•င့်•ဝတ် •သိတတ်•သော •စိတ်•တို့•ရှိ•က…
887 <data>•ထို•သူ•တို့သည် •အချင်းချင်း •မေတ္တာ•ထား၍ •ဆက်ဆံ•ကျ•င့်•သုံး•</data>
895 # Test data originally from http://bugs.icu-project.org/trac/search?q=r30327
900 <data>•តើ<200>លោក<200>មក<200>ពី<200>ប្រទេស<200>ណា<200></data>
901 <data>•សណ្ដូក<200>ក<200>បណ្ដែត<200>ខ្លួន<200></data>
902 <data>•ពណ៌ស<200>ម្ដេច<200>ថា<200>ខ្មៅ<200></data>
903 #ប្រយោគ|ពី|របៀប|រួបរួម|និង|ភាព|ផ្សេងគ្នា|ដែល|អាច|ចូល<200></data>
904 <data>•ប្រយោគ<200>ពី<200>របៀប<200>ដែល<200>និង<200>ភាព<200>ផ្សេងគ្នា<200>ដែល<200>អាច<200>ចូល<200></d…
905 #ប្រយោគ|ពី|របៀប|ជា|មួយ|និង|ភាព|ផ្សេងគ្នា|ដែល|អាច|ចូល<200></data>
906 <data>•សូម<200>ចំណាយពេល<200>បន្តិច<200>ដើម្បី<200>អធិស្ឋាន<200>អរព្រះគុណ<200>ដល់<200>ព្រះអង្គ<200><…
907 <data>•ការ<200>ថោកទាប<200>បរិប្បូណ៌<200>ដោយ<200></data>
908 <data>•ប្រើប្រាស់<200>ស្អាត<200>ទាំង<200>ចិត្ត<200>សិស្ស<200>នោះ<200></data>
909 <data>•បើ<200>អ្នក<200>ប្រព្រឺត្ត<200>អំពើអាក្រក់<200>មុខ<200>ជា<200>មាន<200></data>
910 <data>•ប្រដាប់<200>ប្រដា<200>រ<200>រៀនសូត្រ<200>បន្ទប់<200>រៀន<200></data>
911 <data>•ដើរតួ<200>មនុស្សគ<200>ឥត<200>បញ្ចេញ<200>យោបល់<200>សោះ<200>ឡើយ<200></data>
912 <data>•មិន<200>អាច<200>ឲ្យ<200>យើង<200>ធ្វើ<200>កសិកម្ម<200>បាន<200>ឡើយ<200></data>
913 <data>•បន្ត<200>សេចក្ត<200>ទៅទៀត<200></data>
914 <data>•ក្រុម<200>ប៉ូលិស<200>បណ្តាក់<200>គ្នា<200></data>
915 <data>•គ្មាន<200>សុខ<200>សំរាន្ត<200>ដង<200>ណា<200></data>
916 <data>•បាន<200>សុខភាព<200>បរិប្បូណ៌<200></data>
917 <data>•ជា<200>មេចោរ<200>ខ្ញុំ<200>នឹង<200>ស្លាប់<200>ទៅវិញ<200>ជា<200>មេចោរ<200></data>
918 <data>•ឯ<200>ការ<200>វាយ<200>ផ្ចាល<200>ដែល<200>នាំ<200></data>
919 <data>•គេ<200>ដឹក<200>ទៅ<200>សំឡាប់<200></data>
920 #អ្នក|ដែល|ជា|មន្ត្រី|ធំ|លើ|គាត់|ទេ<200></data>
921 <data>•យក<200>ទៅ<200>សម្លាប់ចោល<200>ស្ងាត់<200></data>
922 <data>•ត្រូវ<200>បាន<200>គេ<200>សម្លាប់<200></data>
923 <data>•នៅក្នុង<200>ស្រុក<200>ខ្ល<200>ងហ្ស៊ុន<200></data>
929 <data>•สวัสดี<200>ครับ<200>สบาย<200>ดี<200>ไหม<200> •ครับ<200></data>
933 <data>•บท<200>ที่๑พายุ<200>ไซโคลน<200>โด<200>โรธี<200>อาศัย<200>อยู่<200>ท่ามกลาง<200>\
937 ไมล์<200></data>
949 <data>•\u3041•\u3043•\u3045•\u31f1•</data>
952 <data>•\u3041\u3043\u3045\u31f1•</data>
954 # The following data was originally in RBBITest::TestJapaneseWordBreak()
957 <data>•\u4ECA\u65E5<400>\u306F<400>\u3044\u3044<400>\u5929\u6C17<400>\u3067\u3059<400>\u306D<400>\u…
966 <data>•私<400>達<400>に<400>一<400>〇<400>〇〇<400>の<400>コンピュータ<400>が<400>ある<400>。<0>奈々<400>は<400>ワード<400>…
970 <data>•abc/•s •def•</data>
971 <data>•abc/\u05D9 •def•</data>
972 <data>•\u05E7\u05D7/\u05D9 •\u05DE\u05E2\u05D9\u05DC•</data>
973 <data>•\u05D3\u05E8\u05D5\u05E9\u05D9\u05DD •\u05E9\u05D7\u05E7\u05E0\u05D9\u05DD/\u05D9\u05D5\u05E…
978 <data>•私<400>達<400>に<400>一<400>〇<400>〇〇<400>の<400>コンピュータ<400>が<400>ある<400>。<0>奈々<400>は<400>ワード<400>…
980 <data>•例えば<400>オーストラリア<400>。•</data>
982 <data>•一部<400>の<400>地域<400>では<400>、<0>ブラジル<400>、<0>インドネシア<400>、<0>オーストリア<400>、<0>ニュージーランド<400>で<400…
992 <data>•Αβ, γδ; Ε ζη; Θ ικ. •Λμ νξ! •Οπ, Ρς? •Σ<100></data>
996 <data>•Αβ, γδ; •Ε ζη; •Θ ικ. •Λμ νξ! •Οπ, Ρς? •Σ<100></data>
1003 <data>•Can't<200> •have<200> •breaks<200> •in<200> •xx:yy<200> •or<200> •struct.field<200> \
1004 •for<200> •CS<200>-•types<200>.•</data>
1005 <data>•\uFF92\uFF76\uFF9E<400> •</data>
1009 <data>•Can't<200> •have<200> •breaks<200> •in<200> •xx<200>:•yy<200> •or<200> •struct<200>.•field<2…
1010 •for<200> •CS<200>-•types<200>.•</data>
1011 <data>•\u06c9<200>\uc799\ufffa•</data>
1012 <data>•\uFF92\uFF76\uFF9E<400> •</data>
1026 <data>•\u0E01•\u0E23•\u0E30•\u0E17\u0E48•\u0E2D•\u0E21•\u0E23•\u0E08•\u0E19•\u0E32• •\
1028 \u0E40•\u0E14\u0E47•\u0E01•\u0E21\u0E35•\u0E1B\u0E31•\u0E0D•\u0E2B•\u0E32• •</data>
1039 <data>•abc •- •def •abc •-•def •abc- •def •abc-•def•</data> # With ASCII hyphen
1040 <data>•abc •‐ •def •abc •‐•def •abc‐ •def •abc‐•def•</data> # With Unicode u2010 hyphen
1045 #<data>•abc •- •def •abc •-def •abc- •def •abc-•def•</data> # With ASCII hyphen
1046 #<data>•abc •‐ •def •abc •‐def •abc‐ •def •abc‐•def•</data> # With Unicode u2010 hyphen
1048 <data>•abc •- •def •abc •-def •abc- •def •</data> # With ASCII hyphen
1049 <data>•abc •‐ •def •abc •‐def •abc‐ •def •</data> # With Unicode u2010 hyphen
1053 <data>•abc/•s •def•</data>
1054 <data>•abc/\u05D9 •def•</data>
1055 <data>•\u05E7\u05D7/\u05D9 •\u05DE\u05E2\u05D9\u05DC•</data>
1056 <data>•\u05D3\u05E8\u05D5\u05E9\u05D9\u05DD •\u05E9\u05D7\u05E7\u05E0\u05D9\u05DD/\u05D9\u05D5\u05E…
1067 <data>•\u3084\u3063•\u3071•\u308A\u0020•\u0031\u301C\u0020•\u2026\u2026\u0020•\u30A2\uFF01\u0020•</
1072 <data>•\u3084•\u3063•\u3071•\u308A\u0020•\u0031•\u301C\u0020•\u2026\u2026\u0020•\u30A2\uFF01\u0020•…
1077 <data>•\u3084•\u3063•\u3071•\u308A\u0020•\u0031•\u301C\u0020•\u2026•\u2026\u0020•u30A2•\uFF01\u0020…
1082 <data>•\u3084\u3063•\u3071•\u308A\u0020•\u0031\u301C\u0020•\u2026\u2026\u0020•\u30A2\uFF01\u0020•</
1087 <data>•\u3084•\u3063•\u3071•\u308A\u0020•\u0031\u301C\u0020•\u2026\u2026\u0020•\u30A2\uFF01\u0020•<…
1092 <data>•\u3084•\u3063•\u3071•\u308A\u0020•\u0031\u301C\u0020•\u2026•\u2026\u0020•u30A2\uFF01\u0020•<…