N-gram 文本生成器
基于n-gram的文本生成器
基于统计语言模型(n-gram)的简易文本生成器。可上传 .txt 或粘贴语料,调节 n、平滑等参数,支持随机生成或指定开头生成。
① 训练模型
语料(可直接粘贴文本;支持多语言)
上传 .txt 文件(可多选)
未选择文件
n-gram 阶数 n
分词模式
按词(空格/标点分隔)
按字符(逐字符)
中文分词(按词语切分)
高级设置
平滑参数 α(加性平滑)
大小写不敏感
是
否
保留标点
否
是
(按字符时)保留空白字符
否(更自然)
是
训练模型
插入示例语料
清空语料
当前:未训练
② 生成文本
开头(可留空随机)
生成长度(token 数 / 字符数)
随机性(温度 T)
Top‑k 采样(0=禁用)
随机种子(留空=随机)
生成
复制
下载 .txt
清空输出
注:按"字符"分词时,生成长度指字符个数;按"词"分词时,指 token(词)个数;"中文分词"模式下中文逐字切分、英文按词切分。