「python docx ヘッダー 読み込み」
という検索キーワードで、アクセスがありました。
python-docxを使ってWord文書に設定されているヘッダーの文字列を取得するには、どのようなコードを書けばいいのかを探していた方による検索でしょうか。
python-docxでヘッダーを取得するサンプル
Cドライブのtempフォルダーに、sample.docxを用意しておいてから、以下のスクリプトを実行してください。
doc = docx.Document(r'C:\temp\sample.docx')
for sec in doc.sections:for par in sec.header.paragraphs:
print(par.text)
ヘッダーに設定した文字列が出力されます。
サンプルスクリプトで行っている処理
Word文書でヘッダーは、セクション単位で設定できます。
ですから、まず外側のfor文で各Sectionオブジェクトを順番に取得しています。
for sec in doc.sections:
取得したSectionのheaderプロパティで、セクションの_Headerオブジェクトを取得し、
for par in sec.header.paragraphs:
内側のfor文で、_Headerのparagraphsプロパティを使って、Paragraphオブジェクトを順番に取得して、
for par in sec.header.paragraphs:
Paragraphオブジェクトに用意されているtextプロパティで取得した文字列を、出力しています。
print(par.text)
- Newer:最終段落をWord VBAで削除する
- Older:インストラクターのネタ帳の2020年(令和2年)の人気ページ
Home » Python » python-docxの使い方 » python-docxでWord文書のヘッダー文字列を取得する