WEKO3
アイテム
{"_buckets": {"deposit": "416b6850-1c53-4c44-907d-ff164a5afe58"}, "_deposit": {"created_by": 4, "id": "4035", "owners": [4], "pid": {"revision_id": 0, "type": "depid", "value": "4035"}, "status": "published"}, "_oai": {"id": "oai:naist.repo.nii.ac.jp:00004035", "sets": ["35"]}, "author_link": ["7807", "7808", "7809", "7810"], "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Selecting Syntactic, Non-redundant Segments in Active Learning for Machine Translation", "subitem_alternative_title_language": "en"}]}, "item_7_biblio_info_9": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2017-06", "bibliographicIssueDateType": "Issued"}, "bibliographicIssueNumber": "3", "bibliographicPageEnd": "489", "bibliographicPageStart": "463", "bibliographicVolumeNumber": "24", "bibliographic_titles": [{"bibliographic_title": "自然言語処理", "bibliographic_titleLang": "ja"}]}]}, "item_7_description_7": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "能動学習は機械学習において,逐次的に選択されたデータに対してのみ正解ラベルを付与してモデルの更新を繰り返すことで,少量のコストで効率的に学習を行う枠組みである.この枠組みを機械翻訳に適用することで,人手翻訳のコストを抑えつつ高精度な翻訳モデルを学習可能である.機械翻訳のための能動学習では,人手翻訳の対象となる文またはフレーズをどのように選択するかが学習効率に大きな影響を与える要因となる.既存研究による代表的な手法として,原言語コーパスの単語 n-gram 頻度に基づき n-gram カバレッジを向上させる手法の有効性が知られている.この手法は一方で,フレーズの最大長が制限されることにより,句範疇の断片のみが提示されて,人手翻訳が困難になる場合がある.また,能動学習の過程で選択されるフレーズには,共通の部分単語列が繰り返し出現するため,単語数あたりの精度向上率を損なう問題も考えられる.本研究では原言語コーパスの句構造解析結果を用いて句範疇を保存しつつ,包含関係にある極大長のフレーズのみを人手翻訳の候補とするフレーズ選択手法を提案する.本研究の提案手法の有効性を調査するため,機械翻訳による擬似対訳を用いたシミュレーション実験および専門の翻訳者による人手翻訳と主観評価を用いた実験を実施した.その結果,提案手法によって従来よりも少ない単語数の翻訳で高い翻訳精度を達成できることや,人手翻訳時の対訳の品質向上に有効であることが示された.", "subitem_description_language": "ja", "subitem_description_type": "Abstract"}]}, "item_7_publisher_10": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "一般社団法人 言語処理学会", "subitem_publisher_language": "ja"}]}, "item_7_relation_17": {"attribute_name": "出版者版DOI", "attribute_value_mlt": [{"subitem_relation_type": "isIdenticalTo", "subitem_relation_type_id": {"subitem_relation_type_id_text": "https://doi.org/10.5715/jnlp.24.463", "subitem_relation_type_select": "DOI"}}]}, "item_7_rights_18": {"attribute_name": "権利", "attribute_value_mlt": [{"subitem_rights": "Copyright c 2017 一般社団法人 言語処理学会", "subitem_rights_language": "ja"}]}, "item_7_source_id_12": {"attribute_name": "EISSN/PISSN", "attribute_value_mlt": [{"subitem_source_identifier": "1340-7619", "subitem_source_identifier_type": "ISSN"}]}, "item_7_source_id_14": {"attribute_name": "書誌レコードID", "attribute_value_mlt": [{"subitem_source_identifier": "AN10472659", "subitem_source_identifier_type": "NCID"}]}, "item_7_text_25": {"attribute_name": "NAIST ID", "attribute_value_mlt": [{"subitem_text_value": "84361377"}, {"subitem_text_value": "73296626"}]}, "item_7_version_type_20": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_access_right": {"attribute_name": "アクセス権", "attribute_value_mlt": [{"subitem_access_right": "open access", "subitem_access_right_uri": "http://purl.org/coar/access_right/c_abf2"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "三浦, 明波", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "7807", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "中村, 哲", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "7808", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "Neubig, Graham", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "7809", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "Paul, Michael", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "7810", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2023-03-02"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "24_463.pdf", "filesize": [{"value": "860.5 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_note", "mimetype": "application/pdf", "size": 860500.0, "url": {"label": "fulltext", "objectType": "fulltext", "url": "https://naist.repo.nii.ac.jp/record/4035/files/24_463.pdf"}, "version_id": "8695bf86-e71b-43f5-b791-1e4aa8cdd17a"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "統計的機械翻訳", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "能動学習", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "人手翻訳", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "対訳コーパス", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "構文解析", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "句構造解析", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "journal article", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "統語的一貫性と非冗長性を重視した機械翻訳のための能動学習手法", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "統語的一貫性と非冗長性を重視した機械翻訳のための能動学習手法", "subitem_title_language": "ja"}, {"subitem_title": "トウゴテキ イッカンセイ ト ヒジョウチョウセイ オ ジュウシシタ キカイホンヤク ノ タメ ノ ノウドウ ガクシュウ シュホウ", "subitem_title_language": "ja-Kana"}]}, "item_type_id": "7", "owner": "4", "path": ["35"], "permalink_uri": "http://hdl.handle.net/10061/12133", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2017-09-21"}, "publish_date": "2017-09-21", "publish_status": "0", "recid": "4035", "relation": {}, "relation_version_is_last": true, "title": ["統語的一貫性と非冗長性を重視した機械翻訳のための能動学習手法"], "weko_shared_id": -1}
統語的一貫性と非冗長性を重視した機械翻訳のための能動学習手法
http://hdl.handle.net/10061/12133
http://hdl.handle.net/10061/121338cd856b3-b4a8-406d-9866-5c386d949f95
名前 / ファイル | ライセンス | アクション |
---|---|---|
fulltext (860.5 kB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2017-09-21 | |||||
タイトル | ||||||
タイトル | 統語的一貫性と非冗長性を重視した機械翻訳のための能動学習手法 | |||||
タイトル | ||||||
タイトル | トウゴテキ イッカンセイ ト ヒジョウチョウセイ オ ジュウシシタ キカイホンヤク ノ タメ ノ ノウドウ ガクシュウ シュホウ | |||||
その他のタイトル | ||||||
その他のタイトル | Selecting Syntactic, Non-redundant Segments in Active Learning for Machine Translation | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 統計的機械翻訳 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 能動学習 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 人手翻訳 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 対訳コーパス | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 構文解析 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 句構造解析 | |||||
資源タイプ | ||||||
資源タイプ | journal article | |||||
アクセス権 | ||||||
アクセス権 | open access | |||||
著者 |
三浦, 明波
× 三浦, 明波× 中村, 哲× Neubig, Graham× Paul, Michael |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 能動学習は機械学習において,逐次的に選択されたデータに対してのみ正解ラベルを付与してモデルの更新を繰り返すことで,少量のコストで効率的に学習を行う枠組みである.この枠組みを機械翻訳に適用することで,人手翻訳のコストを抑えつつ高精度な翻訳モデルを学習可能である.機械翻訳のための能動学習では,人手翻訳の対象となる文またはフレーズをどのように選択するかが学習効率に大きな影響を与える要因となる.既存研究による代表的な手法として,原言語コーパスの単語 n-gram 頻度に基づき n-gram カバレッジを向上させる手法の有効性が知られている.この手法は一方で,フレーズの最大長が制限されることにより,句範疇の断片のみが提示されて,人手翻訳が困難になる場合がある.また,能動学習の過程で選択されるフレーズには,共通の部分単語列が繰り返し出現するため,単語数あたりの精度向上率を損なう問題も考えられる.本研究では原言語コーパスの句構造解析結果を用いて句範疇を保存しつつ,包含関係にある極大長のフレーズのみを人手翻訳の候補とするフレーズ選択手法を提案する.本研究の提案手法の有効性を調査するため,機械翻訳による擬似対訳を用いたシミュレーション実験および専門の翻訳者による人手翻訳と主観評価を用いた実験を実施した.その結果,提案手法によって従来よりも少ない単語数の翻訳で高い翻訳精度を達成できることや,人手翻訳時の対訳の品質向上に有効であることが示された. | |||||
書誌情報 |
ja : 自然言語処理 巻 24, 号 3, p. 463-489, 発行日 2017-06 |
|||||
出版者 | ||||||
出版者 | 一般社団法人 言語処理学会 | |||||
EISSN/PISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 1340-7619 | |||||
出版者版DOI | ||||||
関連タイプ | isIdenticalTo | |||||
識別子タイプ | DOI | |||||
関連識別子 | https://doi.org/10.5715/jnlp.24.463 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10472659 | |||||
権利 | ||||||
権利情報 | Copyright c 2017 一般社団法人 言語処理学会 | |||||
著者版フラグ | ||||||
出版タイプ | VoR |