音声認識fs(Julius)

Julius(オープンソースソフトウェア)


Julius/Julianはフリーの高性能音声認識ソフトウェアです.

数万語の語彙を対象とした文章発声の認識を行う能力を持ちます.

Juliusは高速な音声認識を一般的なスペックのPC上で実現します.

認識率は,20,000語彙の読み上げ音声で90%以上です.

Juliusは,統計言語モデルである単語N-gramを用いた認識を行います.

テキストコーパスから学習された単語3-gramを用いて,大語彙の汎用音声認識(書き下し/ディクテーション)を行うことができます.


また,記述文法に基づく認識を行うこともできます.

文のパターンを人手で記述した認識用文法(有限状態文法)を用いることで,小語彙の音声対話システムや音声コマンド入力など比較的小規模な音声認識システムを容易に構築できます.

この機能を持つJuliusは「Julian」と呼ばれ,単語N-gramを用いるJuliusとソースレベルで統合されています.

なお本サイトでは,このJuliusとJulianを両方含んだパッケージ全体を,まとめて「Julius」と表記しています.

Julius に関する表記の多くは Julian にもあてはまります.


Julius/Julianの最大の特徴はその可搬性にあります.

発音辞書や言語モデル・音響モデルなどの音声認識の各モジュールを組み替えることで,様々な幅広い用途に応用できます.

また数語〜数万語までの辞書に1つの実行バイナリでスケーラブルに対応できます.


Juliusはオープンソースソフトウェアです.プログラムのソース(C言語)を完全公開しているので,他プラットフォームへの移植や改造も容易です.

またライセンスはオープンライセンスで,商用利用への制限もありません.

バグ報告,要望などの議論,そして開発参加者も随時募集しています.


大語彙連続音声認識エンジン Julius
http://julius.sourceforge.jp/

Julius GUI
http://www.sp.m.is.nagoya-u.ac.jp/people/banno/julius_gui.html

Julius for SAPI 2.3 README
http://julius.sourceforge.jp/sapi/Docs/00readme-sapi.html


音声認識ソフトを作ろう
http://www1.bbiq.jp/kougaku/speech_reco.html