2018-10-01

タイ文字を探す

ある原稿のテキストに、タイ語の文字が混じっていました。テキストエディターやワードではデフォルトで多言語のフォントが指定されているのか、タイ文字も普通に表示されますが、Indesignにはるとタイ文字が表示できず、いわゆる豆腐の文字化けになってしまいます。タイ文字はタイ語のフォントを指定しないといけないようです。
原稿の中でどこでタイ語が使われているか検索する方法はないかと思って調べてみると、まず見つかったのが、こちらのUnicode文字プロパティの記事でした。正規表現検索で、[\p{Thai}]としてタイ文字を検索できそうです。試してみると、テキストエディターのjeditΩでは、この表記でタイ文字の検索に成功しました。別のテキストエディターmiとIndesignの正規表現検索では、[\p{Thai}]は無効でした。とりあえずこれで、jeditΩを使ってIndesignに持っていく前にタイ文字のところに検索置換で何らかのマーキングをしておくことができそうです。
同じ記事の追記にリンクされていたこちらでは、文字種ごとのunicode番号の範囲が書かれているっぽい(英語あんまりわかりません)です。
0E00..0E7F; Thai
とあるので、[\u0E00-\u0E7F]として検索すると、jeditΩでもmiでもタイ文字を検索できました。Indesignの正規表現検索では[<0E00>-<0E7F>]。Indesignで検索できれば、検索置換で文字スタイルを適用するとか正規表現スタイルを使用するとかどうとでもフォント指定が出来そうです。(試してみたら、正規表現スタイルでは[<0E00>-<0E7F>]の指定は無効でした)

追記
Indesignの正規表現スタイルでは[\x{0E00}-\x{0F7F}]するとスタイルを適用することができました。コメントで大石十三夫さんに教えていただきました。

このエントリへの反応

  1. はじめまして…
    沢辺さんのtweetから訪問しました。

    InDesignでのユニコード表記は
    [\x{0E00}-\x{0F7F}]
    としてみてください。
    これで大丈夫かと思います。

  2. 大石十三夫様
    コメントありがとうございました。
    [\x{0E00}-\x{0F7F}]の表記で正規表現スタイルを使ってタイ文字に文字スタイルを適用することができました。