かざいむ日誌

IT関係で知ったことなどを記事としてあげていきます。内容に不備や質問などあればぜひコメントをよせてください。

Mouse Dictionaryのラオ日用のデータを作った。

Mouse Dictionaryを使ってみたら辞書を引くのが全く苦にならなくなってうれしかった。できれば多くの人に使ってみてもらいたい。

qiita.com

で、これはラオス語でも使えるなと思ったので、手持ちのデータからラオス語用のデータを作ったのでメモとラオス語のデータを貼っておく。データはTSVで作ったが、サンプルファイルを見たところ元の言葉、訳語+解説という形でタブ文字で区切った2列のデータ形式になる。そして、訳語+解説の部分で改行したい場合は、¥nを入れる。

ສະບາຍດີ△こんにちは。\nサバイディーは一日中使える。

△はタブ文字

 

以下がダウンロードリンク。

drive.google.com

 

課題

  • 表記の揺れ、「わらい」「笑い」といったものはどのようなフォーマットで記載すべきか調べる
  • ຫນ, ໜ ຫລ, ຫຼなどは機械的にできる
  • ພິພິດທະພັນ、ປະຈຸບັນなど表記の揺れのある単語は個別に登録する必要がある
    ルール化が難しい印象がある

 

追記

使ってもらって以下のようなアドバイスをもらった

  • ໄດ້などの一音節で意味の多い単語について説明を加えると良い
  • 表記の揺れに対応するとよい(声調文字の位置など)
    声調の表記の誤りはプログラムで処理して登録を行うと良さそう