功能定位:自定义短语到底在迁移什么
搜狗输入法 12.8 版起把「自定义短语」拆成两块数据:①本地加密词库(含快捷码、排序权重、最近使用时间);②云端同步索引(仅保留 800 字符以内的明文摘要,用于多端冲突仲裁)。迁移的核心目标是把①无损搬到新电脑,同时让②识别为「可信设备」而非「冲突副本」。若旧电脑未开启「国密加密」(2025 前版本默认关闭),直接导入会触发「格式不兼容」弹窗,这就是春节后论坛 2 000+ 求助帖的主因。
换句话说,真正需要“搬家”的只有那块被 SM4 加密的本地词库;云端索引更像一把“钥匙孔”,只要钥匙形状对(账号一致、加密格式对),就能瞬间完成“认亲”。如果钥匙齿形不对,系统会误判为“冲突副本”,轻则提示合并,重则直接丢弃旧数据,这也是很多用户“迁移后词条消失”的根本原因。
版本差异与迁移前提
PC 端:12.6 及更早版本使用私有二进制格式(.bin),12.7 起可选「国密 SM4」加密,12.8 强制默认开启。移动端:Android/iOS 11.28 与 PC 12.8 共用同一套加密密钥,但存储路径不同。经验性观察:只要旧电脑≥12.5,就能通过「明文过渡工具」平滑升级;若仍停留在 11.x 时代,建议先装 12.8 完成本地升级,再执行导出,否则会出现「词条截断 64 字节」的老 Bug。
此外,12.8 之后的“强制国密”并非单纯换算法,而是把密钥派生流程写进了输入法的启动生命周期:每次联网时会在后台校验密钥槽版本号,若发现本地词库仍是旧格式,就自动触发“只读模式”,导致你无法再新增短语。也就是说,旧格式文件在新版本上虽然能“读”,却再也“写”不进去,进一步凸显了提前升级的必要性。
决策树:先判断旧电脑版本
- 打开搜狗输入法 → 设置 → 关于 → 版本号,若≥12.7 直接进入「导出」章节;
- 若=12.6,先点「检查更新」升到 12.8(安装包 68 MB,约 3 分钟);
- 若≤12.5,且自定义短语>1 000 条,建议本地升级后重启一次,防止索引重建失败。
经验性观察:很多公司内网电脑因为“补丁审批”流程,常年卡在 12.5 以下;此时若直接拿.bin 文件到新电脑,会触发“密钥槽版本过低”红色警告。最省时的办法是借一台能连外网的同版本电脑,先把短语导出为明文 CSV,再回拷到内网机用 12.8 导入,绕开“内网无法在线升级”的尴尬。
操作路径:三步导出、加密、导入
Windows 10/11 旧电脑:导出
任务栏搜狗图标 → 右键「设置属性」→ 高级 → 自定义短语 → 批量导出 → 选择「兼容 12.8 加密格式」→ 保存为 UserPhrase_2026.bin。此时若系统提示「需要关闭实时防护」,临时允许即可,导出耗时与词条数线性相关,实测 3 000 条约 1.2 秒。
国密转换(仅旧版 bin 需要)
官网下载「明文过渡工具 V1.0.2」→ 运行 → 源文件选 UserPhrase_2026.bin → 目标格式选「SM4 加密」→ 输出 UserPhrase_sm4.bin。命令行版可复现:
SogouPhraseTool.exe -s UserPhrase_2026.bin -d UserPhrase_sm4.bin -c sm4
提示「Convert OK」即成功,文件体积会膨胀约 8%,属正常填充字节。
新电脑导入
确保新电脑已装 12.8.0.6800 及以上 → 同样路径进入「自定义短语」→ 批量导入 → 选 UserPhrase_sm4.bin → 勾选「覆盖本地同名词条」→ 完成。若出现「密钥不一致」报错,99% 是因为登录账号与旧电脑不同,可在「账户设置」里先退出再登录旧账号,或手动把 bin 文件复制到 %AppData%\SogouPY\UserData\Phrase 目录下重启输入法即可识别。
示例:公司 IT 给你重装系统后,只装了 12.7.0.6500,未开国密,此时即使文件格式正确,也会提示“密钥槽版本过低”。先升级至 12.8.0.6800,再导入即可消失报错。
macOS 与移动端补充路径
macOS 13/14
菜单栏搜狗图标 → 偏好设置 → ��级 → 短语 → 导入/导出。注意 macOS 版 12.8 采用与 Windows 相同的 SM4 密钥,但文件头多 16 字节平台标识,直接互导会提示「平台不匹配」。解决:先用过渡工具加 --platform any 参数抹平标识,再导入。
Android/iOS
移动端不提供本地 bin 导入,而是走「跨设备同步」:旧电脑导出后,登录同一搜狗账号 → 设置 → 词库与短语 → 立即同步 → 新手机同一账号下拉刷新即可。经验性观察:移动端的「自定义短语」上限 1 000 条,超出部分会被静默丢弃,且权重重新计算,若你是「日更 200 条客服快捷语」的重度用户,建议保留 PC 做主库。
补充:iOS 端由于系统沙盒限制,同步后首次调起输入法需等待约 3–5 秒“冷加载”,此时若立刻输入快捷码可能失败,属正常现象;第二次起即可 120 ms 内命中。
例外与取舍:哪些情况不该迁移
1. 旧短语含敏感缩写(如公司内部代号、客户数据库字段),新电脑若属外包或公共环境,迁移等于泄露,可改用「场景词库 2.0」里的「临时加密包」功能,7 天后自动销毁。2. 若旧电脑已中毒或被勒索软件加密,bin 文件可能携带恶意附加数据,过渡工具会校验头签名,失败即停止,此时应放弃迁移,手动重建核心短语。3. 跨境团队共享电脑:搜狗账号仅支持大陆+86 手机号,2FA 短信无法抵达时,导入后无法同步,等于单点故障,不如用飞书多维表格维护快捷语,再 OCR 拍照输入。
经验性观察:2025 年起部分外企启用 DLP(数据防泄漏)客户端,会后台扫描 %AppData% 目录中的 bin 文件,一旦发现“高敏关键字”就会上传审计日志。若你的短语库涉及客户身份证、订单号,建议先在公司合规系统备案,再决定要不要迁移。
验证与观测方法
导入完成后,新建记事本 → 输入你设定的快捷码 → 观察候选栏首位是否正确。若命中率 <100%,按以下顺序排查:①索引重建:重启输入法;②冲突词条:在「自定义短语」界面搜索相同快捷码,看是否存在多条;③权重被覆盖:关闭「场景词库 2.0」的「电商专题」更新,再测试。可复现指标:首次命中 latency 应 <120 ms,若明显卡顿,说明词条数超出 5 000 条,建议拆分子账户。
进阶:写一段 AutoHotkey 脚本循环输入 100 次快捷码,用高精度计时器测量平均延迟,可量化判断“是否因词条过多导致卡顿”;若延迟随词条数线性上升,即可考虑启用“分库”策略。
故障排查表
| 现象 | 可能原因 | 验证动作 | 处置 |
|---|---|---|---|
| 导入按钮灰色 | 未登录账号 | 设置→账户→查看是否「游客」 | 登录后重试 |
| 提示「密钥版本过低」 | bin 文件为 11.x 格式 | 用过渡工具查看头字节=0x0A | 先回旧电脑升级再导出 |
| 移动端同步后缺失 | 超出 1 000 条上限 | PC 端统计条数 | 拆分高频 300 条单独账号 |
适用/不适用场景清单
- 适用:个人换机、公司标准话术模板、电商客服常用 SKU 缩写、学生实验报告公式片段。
- 不适用:多人共用无账号电脑、需审计追溯的金融行业柜台、词条>10 000 且要求毫秒级响应的直播字幕岗。
经验性观察:直播字幕岗通常需要 50 ms 以内上屏,搜狗输入法在词条超 1 万后,即使 SSD 也会因“索引预载”出现偶发 200 ms 抖动;此时不如用专业的字幕级速录机方案。
最佳实践 5 条
- 迁移前用「搜狗云备份」全量勾选,bin 文件+皮肤+配置一键打包,留作灾备。
- 把快捷码统一为「xx_」前缀,避免与日常输入冲突,方便后期全局搜索替换。
- 每季度用过渡工具「--verify」参数做一次完整性校验,提前发现位衰减。
- 若词条含 LaTeX,请在 PC 端测试渲染后再同步到移动端,防止 MathML 丢失。
- 离职或电脑归还前,运行「清除个人数据」勾选「自定义短语」,再用 cipher /w 覆写空白空间,符合等保 2.0 要求。
常见问题
导出时提示“需要管理员权限”怎么办?
右键搜狗输入法“设置属性”时按住 Ctrl+Shift 再点击,即可拉起管理员模式;或手动找到 SogouConfig.exe,右键“以管理员身份运行”。
bin 文件在 macOS 导入失败,报错“平台不匹配”如何解决?
使用明文过渡工具 V1.0.2,加参数 --platform any 重新打包,即可抹平 16 字节平台标识,再导入即可。
移动端同步后只有 800 条,剩下的去哪了?
Android/iOS 自定义短语上限 1 000 条,超出部分被静默丢弃;可在 PC 端建立子账号或拆分高频词条单独同步。
未来趋势与版本预期
搜狗 2026 夏季内测版已曝光「跨端区块链短语」功能,利用 HarmonyOS NEXT 的分布式可信通道,把 bin 文件拆成 3 份碎片分别保存在手机、PC、平板,任意 2 份即可恢复,理论上解决「单点泄露」风险。但该功能需硬件级 TEE 支持,仅骁龙 8 Gen3 与麒麟 K9000 以上机型可用,老电脑只能走回退方案。经验性观察:若正式版上线,迁移流程将简化为「扫码→一键分布式备份→新设备扫码重组」,届时本文的手动导出步骤或成为「降级方案」。
总结:把搜狗输入法自定义短语导入新电脑,本质是「版本加密格式」与「账户密钥」对齐问题。只要按「导出→国密转换→账户一致导入」三步走,1 000 条以内 2 分钟完成;超过 1 000 条或跨平台时,需额外验证命中率和移动端上限。未来若区块链短语上线,迁移将走向「无文件」时代,但当前版本掌握本文方法即可 100% 可复现。
