path = "test.docx"
以工程下venv
文件夹为父目录
补充:Python读取指定目录下指定后缀文件并保存为docx
最近有个奇葩要求 要项目中的N行代码 申请专利啥的
然后作为程序员当然不能复制粘贴 用代码解决。。
使用python-docx读写docx文件
环境使用python3.6.0
首先pip安装python-docx
1
|
pip install python - docx |
然后下面是脚本 修改目录,这里默认取脚本运行目录下的src文件夹
取.cs后缀的所有文件 读取并保存为docx
有一点需要注意,如果文件中有中文,请用vscode或者其他编辑器使用utf-8格式打开,看看有没有乱码 其中每处理一个文件都会有print输出 当看到只有---start没有end的时候就可以找到该文件查看是否有上面说的情况,修改后保存重新执行,一直到全部执行完毕,保存好docx文件
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
# -- coding: UTF-8 -- # Created by luody on 2017/4/7. import os from docx import Document saveFile = os.getcwd() + "/code.docx" mypath = os.getcwd() + "/src" doc = Document() doc.add_heading( "代码文档" , 0 ) p = doc.add_paragraph( '服务端代码,使用语言' ) p.add_run( 'C#,SQL' ).bold = True lineNum = 0 for root, dirs, files in os.walk(mypath): for filespath in files: if (filespath.endswith( '.cs' )): doc.add_heading(filespath, level = 1 ) codePage = '' print (filespath + ' ---- start' ) for line in open (os.path.join(root, filespath), encoding = "utf-8" ): codePage + = line lineNum + = 1 print (filespath + ' ---- end' ) doc.add_paragraph(codePage, style = 'IntenseQuote' ) doc.add_page_break() p = doc.add_paragraph(u '总行数:' ) p.add_run( str (lineNum)).bold = True doc.save( 'code.docx' ) print (lineNum) |
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/qq_40345954/article/details/103983115