テキストをより小さい単位であるトークンに分割するためのツール。主に[[NLP]]の前処理で使われる。