Title:Semantic Drift in Multilingual Representations

Authors:Lisa Beinborn, Rochelle Choenni

Download PDF

Abstract: 多言語表現については、特定のタスクにおけるパフォーマンスに基づいて評価されることがほとんどであったが、本論文では、多言語表現におけるセマンティックドリフト(SEMANTIQUE DRAFT)について述べる。 本稿では、工学的な目標にとどまらず、計算表現における言語間の関係性を分析する。 本稿では,工学的な目標にとどまらず,計算表現における言語間の関係を分析し,意味的な概念の構成に基づいて言語を比較するための方法論を紹介する. 我々は、計算機による多言語表現において、選択された概念の集合に対して、表現上の類似性分析を適応的に行うことを提案する。 この解析方法を用いることで、言語専門家が想定する系統樹に近い系統樹を再構成することができる。 これらの結果は、単言語テキストと対訳辞書のみで学習させた多言語分布表現が、語源情報を必要とせずに言語間の関係を保持することを示している。 さらに、言語族間の意味的なずれを識別するための指標を提案する。 単語ベースと文ベースの多言語モデルで実験を行い、定量的な結果と定性的な例を示す。 多言語表現における意味ドリフトの解析は、計算モデルの望ましくない特性を示すことができるとともに、言語間の言語現象を研究するための定量的な手段を提供することができる。 このコードは、このhttpsのURLから入手できます。

Articles

コメントを残す

メールアドレスが公開されることはありません。