Home » Python » python-docxの使い方 » python-docxでWord文書のヘッダー文字列を取得する

python-docxでWord文書のヘッダー文字列を取得する

動作検証バージョン:64bit版 Windows 10 Pro + Python 3.8.0 + python-docx 0.8.10

「python docx ヘッダー 読み込み」
という検索キーワードで、アクセスがありました。

python-docxを使ってWord文書に設定されているヘッダーの文字列を取得するには、どのようなコードを書けばいいのかを探していた方による検索でしょうか。

[スポンサードリンク]

python-docxでヘッダーを取得するサンプル

Cドライブのtempフォルダーに、sample.docxを用意しておいてから、以下のスクリプトを実行してください。

import docx

doc = docx.Document(r'C:\temp\sample.docx')

for sec in doc.sections:
    for par in sec.header.paragraphs:
        print(par.text)

ヘッダーに設定した文字列が出力されます。

サンプルスクリプトで行っている処理

Word文書でヘッダーは、セクション単位で設定できます。

ですから、まず外側のfor文で各Sectionオブジェクトを順番に取得しています。
  for sec in doc.sections:

取得したSectionのheaderプロパティで、セクションの_Headerオブジェクトを取得し、
      for par in sec.header.paragraphs:

内側のfor文で、_Headerのparagraphsプロパティを使って、Paragraphオブジェクトを順番に取得して、
      for par in sec.header.paragraphs:

Paragraphオブジェクトに用意されているtextプロパティで取得した文字列を、出力しています。
          print(par.text)

[スポンサードリンク]

Home » Python » python-docxの使い方 » python-docxでWord文書のヘッダー文字列を取得する

「python-docxの使い方」の記事一覧

検索


Copyright © インストラクターのネタ帳 All Rights Reserved.

.