起因
在使用PyCharm调用Python Console的时候,调取HanLP的Debug模式会显示各种各样的乱码,但分词的结果是正常的中文。在cmd和PowerShell直接运行是正常的。文档的存储是UTF-8格式,Python Console里的Java输出是GBK。
究极解决方法
控制面板 – 时钟和区域 – 更改日期、时间或数字格式 – 管理 – 更改系统区域设置 – Beta版UTF-8 (注意会导致中文文件名到其他GBK电脑出现乱码)
将系统的编码整体转换为UTF-8,重启电脑。
补充方案
Windows 增加Java的环境变量,设置编码为 UTF-8:
JAVA_TOOL_OPTIONS="-Dfile.encoding=UTF-8"
PS: 默认运行Terminal改成PowerShell可以用Linux命令。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/174054.html原文链接:https://javaforall.net
