コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。
Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。
Q&A
解決済
1回答
2734閲覧
退会済みユーザー
総合スコア0
0グッド
0クリップ
投稿2018/11/08 06:30
0
この記事のなかでMeCabを使ってコーパスを分かち書きにする部分があるのですが、私の場合、コマンドプロンプトで実行すると
input-buffer overflow. The line is split. use -b #SIZE option.
というメッセージが何個も出てきます。 どうすればいいのでしょうか?
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答1件
ベストアンサー
デフォルトだと1行あたりの8192文字を超えた時に表示されるようですね -bオプションを付けてバッファサイズ増やすことができるようです。 ただし増やすとそれなりにマシンに負荷がかかります
投稿2018/11/08 06:40
総合スコア114581
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.50%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
MeCabで分かち書きしようとしたらエラーが発生した
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。