Word(docx)ファイルからテキストを抽出する方法はありますか?
(ファイルはGoogleドライブのフォルダに保存されています)
blobを使用しようとしましたが、役に立ちませんでした。
↓試したコード
GoogleAppsScript
1function docx() { 2 var docxId ="********"; 3 var docx = DriveApp.getFileById(docxId); 4 var blob = docx.getBlob(); 5 var file = Drive.Files.insert({}, blob, {convert:true}); 6 var id = file["id"]; 7 var doc = DocumentApp.openById(id); 8 var text = doc.getBody().getText(); 9 return text; 10}
Word(docx)から、直接のテキスト抽出は厳しいんじゃないでしょうか?
GASでGoogleDocument形式に変換してから getBody().getText() するしかないかと。
あなたの回答
tips
プレビュー