Shuichi Murozono
IBM WebSphere Voice Server
IBM Japan Systems Engineering Co.,Ltd.
アプリケーション開発環境
AD-1
当資料は、VoiceXMLコンソシアムの講演に使用した資料です。2002年2月現在のIBM製品及び他社製品の情報に基づいて作成されております。この資料に含まれている
情報は可能な限り正確を期しておりますが、リリースアップ/修正版等により仕様が変更される可能性があります。
当資料に掲載されていた全ての内容に関して日本IBM(株),日本IBM SE(株)は保証をするものではありません。
この資料について
AD-2
Agenda
アプリケーション・モデル
音声Webアプリケーション
開発キット
WebSphere Voice Server SDK
WebSphere Studio
Reusable Dialog Component
AD-3
アプリケーション・モデル
基幹業務システムの音声応答対応Web ServiceCTI(Computer Telephony Integration)モバイル・ソリューション
Client/Server
Network Computing
Mobile "anytime, anyplace"
Business
Business
AD-4
音声Webアプリケーション構成
プレゼンテーションと音声処理の独立プレゼンテーション・レイヤー (Web Application Server)音声処理レイヤー (Voice Server)
音声処理レイヤーVoiceXMLアプリケーション
システム構築・運用の効率化開発・テスト・運用を独立して構築可能
Content
Content
Content
WebSphereApplication
Server
DB
Apps
External WAP
Service
WebSphereEveryPlace
Suite
WebSphere Portal Server
WebSphereVoiceServer
AD-5
アプリケーション・データ・フロー
Speech Browser
Reco Synth
grammars
wordswords
HTTP Server
Java Servlet
Business Logic/Bean Data
JSP Markup
Templates
URL request
markup
audioaudio
Datarequest
Application-specific, independent of access modalityApplication-specific, speech-specific, authored
クライアント Webサーバー
URL
markup
Application-independent
ユーザー
callpageservlet API
data -populated bean
Application-specific, speech-specific, templatesautomatically generated, customized for speech
AD-6
音声Webアプリケーション階層構造
Gatekeeper
HTTP
Server Stack n
VoiceXMLアプリケーション
VoiceXML Browser
JMF/JTAPI JSAPI
ViaVoiceEngine
Server Stack 2
VoiceXMLアプリケーション
VoiceXML Browser
JMF/JTAPI JSAPI
ViaVoiceEngine
Server Stack 1
VoiceXMLアプリケーション
VoiceXML Browser
JMF/JTAPI JSAPI
ViaVoiceEngine
VoIP
AD-7
アプリケーション開発キット
音声認識製品WebSphere Voice Server V2.0
アメリカ英語,イギリス英語,フランス語,ドイツ語
イタリア語,スペイン語,日本語,中国語(簡体),中国語(繁体)
開発キットWebSphere Voice Server SDK V2.0WebSphere Studio V4.0Reusable Dialog Component
プラットホームWindows 2000 ServerJRE(Java Runtime Environment) V1.3.0
AD-8
WebSphere Voice Server SDK
ランタイム・エンジン認識エンジン合成エンジン
VoiceXML Browser(インタープリター)
テスト環境マイクロフォン・ドライバー
オンライン・ドキュメントSpeech User Interface GuidelinesHints, Tips, and Best PracticesVoiceXML Language DetailsIBM Extension Details
サンプル・コードVoiceXML サンプルコード
AD-9
VoiceXML Browser
VoiceXMLインタープリター
起動コマンド・ライン
vsaudio_XXXX.batvstext_XXXX.bat(音声入出力をコンソールへシュミレート)
WebSphere Studio
オプション設定起動ファイルへコマンドの追加Bargein/Cache/Duplex/Timeout etc
トレース機能アプリケーションの動作状況の取得vxml.log
AD-10
VoiceXML Browserオプション
Bargeinユーザー発声による、プロンプト合成出力のキャンセル設定
CacheVoiceXML Browserへのキャッシュ設定
Duplexユーザー発声とプロンプト合成出力の併用使用設定
GUIDTMFシミユレーション・パネルの表示設定
Timeout音声入力のタイムアウト設定
:Execute -Dvxml.bargein=energy -Dvxml.cache=false -Dvxml.timeout=10
参考例(vsaudio_en_US.bat/vstext_en_US.bat)
AD-11
17:16:57.979 C: Would you like to continue?17:17:12.700 A: speech detected17:17:12.700 A: Audio level (0.4)17:17:12.900 A: Audio level (0.7)17:17:14.473 H: yes17:17:14.483 C: Begin speaking after the tone.
When finished recording, pause briefly, then say "Stop Now" or press a DTMF key.
17:17:14.483 C: (audio clip)17:17:23.165 A: recording started17:17:24.137 A: speech detected17:17:24.147 A: Audio level (0.4)17:17:24.577 A: Audio level (0.4)17:17:24.797 A: Audio level (0.5)
トレース参考例
A:Voice Server音声検知H:認識結果(文字列)C:プロンプト合成出力
トレース・フラグ
AD-12
DTMFシミユレーター
電話ボタン入力のシミユレーター
VoiceXMLアプリケーションのテストに使用
AD-13
WebSphere Studio
Webアプリケーション開発生産性+維持管理の容易さ
Webアプリケーション開発のすべての局面をサポート
WebSphere Application Serverとのシームレスな統合
Servletウィザード
Webデザイナー、Javaプログラマー、サイト管理者など役割に応じたツールを提供
JSP(JavaServer Pages)を強力サポート
デザインとロジックの分離を実現
AD-14
WebSphere構成要素
Rule エディター WebSphere Personalization 対応の開発ツール(アドバンスド版内蔵)
Page Detailer Web トランザクションをモニターし、解析するのツール(アドバンスド版付属)
Page Designer ページレイアウト編集ツールHTML, DHTML, cHTML, VoiceXML, JavaScript, JSP開発
Servletウィザードロジック Bean からサーブレット・モデルとJSPモデルを生成(WML, cHTML, VoiceXMLに対応)Webアプリケーション開発時間を短縮し、初心者にもすぐ開発できるツール
ワークベンチすべての Web リソースを管理
HTMLやXMLのリンク関係を表示するビュー発行先を複数コントロールできる発行ウィザードサイト構造の変化を全HTMLにダイナミックに反映SCMツールとの連携によるチーム開発サポートサイト・インポートとアーカイブ機能外部ツールの登録 AD-15
VoiceXML Editor
コード補助機能コード・タグの追加ステートメント文法チェック
コード&オブジェクト挿入<link> <goto> <choice> <audio> <dtmf> <grammar>
文法チェック
VoiceXML Browser起動
発行生成プロジェクトをサーバー(WAS/WVS)へ転送
AD-16
プロジェクト・イメージ
AD-17
VoiceXML Editorイメージ
AD-18
コーディング・イメージ
AD-19
VoiceXML Browserイメージ
AD-20
Reusable Dialog Component
代表的な音声処理サンプルコード開発工数・期間を短縮コーディングの簡素化コードの品質向上
サブダイアログ・コード
テンプレート・コード
グラマー・コード
AD-21
サブダイアログ・コード
代表的な機能のサブ・ファンクション(VXML/GRAM)
サブ・ファンクション名 機能Alpha アルファベット入力AlphaNumeric 英数字入力Browse Selection 候補の選択Confirmation 返事の確認Credit Card クレジットカード入力Currency 金額の入力Date 日時の入力Direction 方向の入力Duration 期間の入力Email Address メールアドレスの入力Expire Date カード等の有効期限入力Number 少数を含む数字入力Social Security 個人ID等の入力Street Type ストリートの種類の入力Telephone Number 電話番号の入力Time 時間の入力URL URL入力AD-22
テンプレート・コード
代表的な業務のサンプルテンプレート(VXML/GRAM)
テンプレート名 業務内容
Address 住所入力サンプルコード
Credit Card クレジットカード決済サンプルコード
Date Range 日程期間サンプルコード
Name 氏名サンプルコード
Time Range 時間サンプルコード
AD-23
メッセージ
業界No1の音声認識率
世界の代表言語に対応
オープン・スタンダードVoiceXML/Java/EJB
豊富な開発ツールSDK/Studio
豊富な情報サイトibm.com
開発支援体制
AD-24