Java学习者论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

恭喜Java学习者论坛(https://www.javaxxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,购买链接:点击进入购买VIP会员
JAVA高级面试进阶视频教程Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程

Go语言视频零基础入门到精通

Java架构师3期(课件+源码)

Java开发全终端实战租房项目视频教程

SpringBoot2.X入门到高级使用教程

大数据培训第六期全套视频教程

深度学习(CNN RNN GAN)算法原理

Java亿级流量电商系统视频教程

互联网架构师视频教程

年薪50万Spark2.0从入门到精通

年薪50万!人工智能学习路线教程

年薪50万!大数据从入门到精通学习路线年薪50万!机器学习入门到精通视频教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程 MySQL入门到精通教程
查看: 797|回复: 0

[默认分类] python2.7下使用logging模块记录日志到终端显示乱码问题解决

[复制链接]
  • TA的每日心情
    开心
    2021-12-13 21:45
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2020-8-11 13:49:30 | 显示全部楼层 |阅读模式
    刚才翻了翻2年以前用python2.7写的一个爬虫程序,主要功能就是把各地市知识产权局/专利局网站的专利相关项目、课题通知,定期爬取和分析,辅助企业进行项目申请。
    这里要谈的不是爬虫功能的实现,而是今天重跑程序的时候发现,日志文件正常展现中文,但是终端展现的确实乱码。影响体验,着实比较郁闷。
      
    相关代码如下:
    1、python文件是utf-8编码
    2、使用logging模块记录日志,同步输出到app.log文件,和终端标准输出。
    3、使用了sys.setdefaultencoding的方式来解决乱码问题。
      

    1. # coding=UTF-8
    复制代码

    1. import sys
    2. import logging
    3. reload(sys)
    4. sys.setdefaultencoding("utf8")  # @UndefinedVariable
    5. cur_path = os.path.dirname(os.path.abspath(sys.argv[0]))
    6. logging.basicConfig(level=logging.INFO,
    7.                 #format="[%(asctime)s] [%(filename)s:%(lineno)d] %(levelname)s %(message)s",
    8.                 format="[%(asctime)s] %(message)s",
    9.                 datefmt="%Y-%m-%d %H:%M:%S, %a",
    10.                 filename=cur_path+"/../log/app.log",
    11.                 filemode="w")
    12. #################################################################################################
    13. # 定义一个StreamHandler,将INFO级别或更高的日志信息打印到标准错误,并将其添加到当前的日志处理对象#
    14. console = logging.StreamHandler()
    15. console.setLevel(logging.DEBUG)
    16. formatter = logging.Formatter("[%(asctime)s] [%(filename)s:%(lineno)d] %(levelname)s %(message)s")
    17. console.setFormatter(formatter)
    18. logging.getLogger("").addHandler(console)
    19. #################################################################################################
    复制代码


      
    标准输入是乱码:
    [2018-02-19 22:07:37,211] [app_main.py:100] INFO ++++++++++ 寮€濮嬪惎鍔ㄦ姄鍙栫▼搴?.. ++++++++++
    [2018-02-19 22:07:37,217] [app_conf.pyo:70] WARNING 娌℃湁鎸囧畾瑕佺瓫閫夋柊闂荤殑璧峰鏃堕棿锛岄粯璁ら€夋嫨褰撴棩銆?
    [2018-02-19 22:07:37,224] [app_conf.pyo:73] WARNING 娌℃湁鎸囧畾瑕佺瓫閫夋柊闂荤殑缁撴潫鏃堕棿锛岄粯璁ら€夋嫨褰撴棩銆?
    [2018-02-19 22:07:37,227] [base_module.pyo:64] INFO ---------- 寮€濮嬫姄鍙栫綉椤靛唴瀹癸紝骞剁瓫閫夋柊闂荤粨鏋溿€?---------
    但是日志文件显示正常:
    [2018-02-19 22:07:37, Mon] ++++++++++ 开始启动抓取程序... ++++++++++
    [2018-02-19 22:07:37, Mon] 没有指定要筛选新闻的起始时间,默认选择当日。
    [2018-02-19 22:07:37, Mon] 没有指定要筛选新闻的结束时间,默认选择当日。
    [2018-02-19 22:07:37, Mon] ---------- 开始抓取网页内容,并筛选新闻结果。----------
      
    查了半天,终于发现棋差一招,使用logging记日志的时候,需要带中文的字符串前面再加上 u
    比如:


      logging.info(
      u"++++++++++ 开始启动抓取程序... ++++++++++ ")
      



      logging.info(
      u"本次抓取结束,总耗时:%d秒\n\n" % (end-start))
      

    这样就完美解决标准输出乱码问题啦。
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|Java学习者论坛 ( 声明:本站资料整理自互联网,用于Java学习者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2024-4-25 08:14 , Processed in 0.413650 second(s), 46 queries .

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表