macOS 10.14であらたに搭載されたNaturalLanguage.frameworkにアクセスして、自然言語テキストが「何語」かを推定し、指定数の言語ごとにその推測した確率を求めるAppleScriptです。
NLLanguageRecognizerも、「最もそれらしいラベル(言語)値」を返すだけでなく、推測候補言語とその確率(0.0〜1.0、1.0が最もそれらしい)をDictionary形式で(AppleScriptでいうところのrecord)出力するメソッドがあります。試しに呼んでみました。
AppleScript名:NLLanguageRecognizerで自然言語の推定 v3 |
— Created 2018-11-13 by Takaaki Naganoya use AppleScript version "2.7" — Mojave (10.14) or later use framework "Foundation" use framework "NaturalLanguage" use scripting additions property NLLanguageRecognizer : a reference to current application’s NLLanguageRecognizer set aNL to NLLanguageRecognizer’s alloc()’s init() –言語推定時の各言語の可能性の数値をリストアップ aNL’s processString:"AppleScriptで日本語を処理。" set langRes1 to (aNL’s languageHypothesesWithMaximum:10) as record –> {|is|:0.017804400995, ro:0.02502822876, fr:0.015569564886, de:0.041996311396, |it|:0.017095085233, nl:0.630239665508, sv:0.041430238634, en:0.11029753834, nb:0.025065546855, hu:0.051682028919} –アルファベットの比率が高まると、日本語として認識される可能性が極端に下がる aNL’s processString:"「「「「了解です!」」」」" –なろう系小説の複数人物の同時発話表現 set langRes2 to (aNL’s languageHypothesesWithMaximum:5) as record –> {|zh-hans|:0.251541793346, ja:0.748288214207, |zh-hant|:1.62590833497234E-4} |
More from my site
(Visited 59 times, 1 visits today)