本研究が完成するには20年程度の歳月を要すると思われるが,設計段階としては4年計画で科学研究費を申請した。4年間の年次計画は以下のとおりである。
1.2007年度
(1)見出し語として『朝鮮語辞典』の最重要語(1350語)を全て入力する。
(2)最重要語の用例を収集方針に基づいて収集し,入力する。
(3)見出し語として入力した最重要語に関して,発生しうる同形異語を予測し,見出し語として入力する。
(4)見出し語として入力した同形異語の用例を収集し,入力する。
(5)アルゴリズムによる形態素解析に関し,綿密な調査とアルゴリズムの精緻化を行う。
(今年度は初級段階の文法項目における形態素解析を中心に作業を行う)
(6)データはその都度インターネットで公開する。
2007年度成果報告書
2.2008年度
(1)見出し語として『朝鮮語辞典』の重要語(3500語)の前半部分を入力する。
(2)重要語の用例を収集方針に基づいて収集し,入力する。
(3)見出し語として入力した重要語に関して,発生しうる同形異語を予測し,見出し語として入力する。
(4)見出し語として入力した同形異語の用例を収集し,入力する。
(5)アルゴリズムによる形態素解析に関し,綿密な調査とアルゴリズムの精緻化を行う。
(今年度は中級段階の文法項目における形態素解析を中心に作業を行う)
(6)データはその都度インターネットで公開する。
2008年度成果報告書
3.2009年度
(1)見出し語として『朝鮮語辞典』の重要語(3500語)の後半部分を入力する。
(2)重要語の用例を収集方針に基づいて収集し,入力する。
(3)見出し語として入力した重要語に関して,発生しうる同形異語を予測し,見出し語として入力する。
(4)見出し語として入力した同形異語の用例を収集し,入力する。
(5)慣用表現を収集して見出し語として入力し,慣用表現の形式で検索できるようにする。
(6)アルゴリズムによる形態素解析に関し,綿密な調査とアルゴリズムの精緻化を行う。
(今年度は形態素解析の一般的なアルゴリズムでは記述できない例外的な同形異語を中心に作業を行う)
(7)データはその都度インターネットで公開する。
4.2010年度
(1)見出し語としてハングル能力検定試験出題基準を中心として5000語を抽出し,最重要語および重要語と重複しない語(以下では追加語と略称する)を入力する。
(2)追加語の用例を収集方針に基づいて収集し,入力する。
(3)慣用表現の用例を収集方針に基づいて収集し,入力する。
(4)見出し語として入力した追加語に関して,発生しうる同形異語を予測し,見出し語として入力する。
(5)見出し語として入力した同形異語の用例を収集し,入力する。
(6)アルゴリズムによる形態素解析に関し,綿密な調査とアルゴリズムの精緻化を行う。
(今年度は形態素解析の再帰的なアルゴリズムを中心に作業を行う)