HTMLをplain textに変換 v2

HTMLのファイルをplain textに変換するAppleScriptです。

前バージョンでは、,△蕕じめHTMLを変数に読み込んでおいて、△修離如璽燭NSString経由でNSAttributedStringに(文字エンコーディングを指定しつつ)読み込んでいました。

このため、,涼奮で文字コードエンコーディングの判定がうまく行かないと、正しいPlain Textが得られないという「弱点」がありました(一応、対策のためにテキストエディタ並みの日本語テキストエンコーディング自動判定ライブラリを併用していますが、毎回掲載するわけにもいきません)。

これに対してShane Stanleyから「こうしたほうが」というツッコミがあったのが本Scriptです。HTMLファイルのファイルパスをNSDataに渡して読み込む、▲如璽燭NSAttaributedStringに読み込む という処理に変更。これまで読み込みに問題のあった(テキストエンコーディング判定失敗)HTMLも正しく読み込めているようです。

AppleScript名:HTMLをplain textに変換 v2
– Created 2017-09-09 by Takaaki Naganoya
– Created 2017-09-09 by Shane Stanley
use AppleScript version “2.4″
use scripting additions
use framework “Foundation”
use framework “AppKit”
–http://piyocast.com/as/archives/4821

property NSAttributedString : a reference to current application’s NSAttributedString
property NSData : a reference to current application’s NSData

set aFile to choose file
set aPlainText to HTMLDecode(POSIX path of aFile) of me

on HTMLDecode(thePath)
  set theData to NSData’s dataWithContentsOfFile:thePath
  
set attStr to NSAttributedString’s alloc()’s initWithHTML:theData documentAttributes:(missing value)
  
return (attStr’s |string|()) as string
end HTMLDecode

★Click Here to Open This Script 

Leave a Reply