WikipediaのREST APIを呼び出して、2つの単語の共通項を計算する「common elements Lib」を作って実際にいろいろ評価していますが、ロシア語を指定したときに結果が得られないという現象に直面していました。
ロシア語を記述するキリル文字のエンコーディング指定がよくなかったのか、Wikipediaのロシア語サーバーの問題なのか、どこに問題点があるのかよくわかっていませんでした(そういう問題のあぶり出しのためにリリースしてみた事情があります)。
とりあえず人名をGoogle翻訳でロシア語+キリル文字に翻訳してロシア語Wikipediaに突っ込んでみても結果が得られず首をひねっていましたが、ロシア語の人名表記が、
First name Family name
ではなく、
Family name, First name
のフォーマットであることに気づきました。この語順で人名を突っ込んでみたところ、無事結果が得られることを確認しました。
AppleScript名:sample_russian |
— – Created by: Takaaki Naganoya – Created on: 2020/03/03 — – Copyright © 2020 Piyomaru Software, All Rights Reserved — use comLib : script "common elements Lib" –"Family Name, First Name" in Russian Language –"George Lucas" and "Steven Spielberg" set cRes to list up common elements with {"Лукас, Джордж", "Спилберг, Стивен"} with language "ru" –> {"Награда имени Ирвинга Тальберга", "Индиана Джонс", "Кинофантастика", "Золотой глобус", "Монтажёр", "Industrial Light & Magic", "Форд, Харрисон", "DreamWorks", "Премия «Сатурн» за лучший сценарий", "Сиквел", "Продюсер", "Кинорежиссёр", "Калифорния", "Сценарист", "Премия «Сатурн» за лучшую режиссуру", "Оскар (кинопремия)"} –"Larry Tesler" and "Steve Jobs" set dRes to list up common elements with {"Теслер, Ларри ", "Джобс, Стив"} with language "ru" –> {"Apple Computer", "Xerox PARC", "Smalltalk", "Стэнфордский университет"} |
ウクライナ語の人名は、
First name Family name
となっているので、そのように書けば結果が得られます。登録記事数がそれほど多くないので、かなり検索語句を選ぶ印象ではあります。
AppleScript名:sample_Ukrainian |
–Українська (Ukrainian) use comLib : script "common elements Lib" –"Bill Gates" and "Steve Jobs" set dRes to list up common elements with {"Білл Гейтс", "Стів Джобс"} with language "uk" –> {"США", "IBM", "Долар США", "Майкрософт", "Головний виконавчий директор", "Стенфордський університет", "Персональний комп’ютер"} |
More from my site
(Visited 68 times, 1 visits today)
Wikipedia経由で2つの単語の共通要素を計算するcommon elements Lib Script Library – AppleScriptの穴 says:
[…] ら側の実装がまずい)問題なのか、サーバー側がREST APIをサポートしていないのか(Wikipediaサーバー側の問題)はわかりません。 → ロシア語のクエリーも処理できることを確認しました […]