Since the units of processing for Natural Language Processing(NLP) are based on syntactic structure, for example sentence, it is necessary to detect the sentence boundary for the Automatic Speech Recognition(ASR) outputs. In this paper at first we propose the feature space that is applied to detecting sentence boundary with Support Vector Machine(SVM) by considering the frequency of the word .mmediately before sentence boundary. At second, we examine using confidence measure of ASR outputs for sentence boundary detection with SVM. We evaluated our methods on the Corpus of Spontaneous Japanese(CSJ).%自然言語処理では処理単位として文などの意味的なまとまりがある単位を用いるため,音声認識結果に対して文境界を示す必要がある.本研究では,まずSVMを用いた文境界検出において文境界直前における語の出現しやすさを考慮することによって文境界検出に適した特徴空間の作成方法を提案する.さらに,音声認識時に認識結果と共に出力される単語信頼度を素性として文境界検出に利用することを検討する.文境界検出においては『日本語話し言葉コーパス(CSJ)』を対象としてSVMを用いて評価実験を行った.
展开▼