Home » Python » python-docxの使い方 » python-docxを使ってWord文書のパラグラフ(段落)を取得する

python-docxを使ってWord文書のパラグラフ(段落)を取得する

動作検証バージョン:64bit Windows 10 Pro + + Python 3.8.3 + python-docx 0.8.10

「python-docx パラグラフ取得」
という検索キーワードでアクセスがありました。

[スポンサードリンク]

python-docxを使ってパラグラフ(段落)を取得するサンプルスクリプト

Cドライブtempフォルダーに、複数の段落が存在するsample.docxを用意しておいてから、以下のスクリプトを実行してください。

import docx


doc = docx.Document(r'c:\temp\sample.docx')

par = doc.paragraphs[0]
print(par.text)

1つ目のパラグラフ(段落)の文字列が出力されます。

Document.paragraphsでParagraphが要素のリストを取得できる

python-docxでは、Documentオブジェクトに用意されているparagraphs属性を使うと、Word文書の段落を表すParagraphオブジェクトを要素として含むリストが取得できます。

リストの1つ目の要素である、1つ目の段落を表すParagraphを取得しているのが、

par = doc.paragraphs[0]

です。

「python-docx パラグラフ取得」
とのことですが、取得しただけでは何が起きているかわからないので、Paragraph.text属性で取得できるその段落の文字列を出力しています。

print(par.text)

Document.paragraphsで取得できるのはリスト

Document.paragraphsで取得できるのはリストですから、

par = doc.paragraphs[0]

par = doc.paragraphs[1]

にすれば、2つ目の段落を表すParagraphが取得でき、

par = doc.paragraphs[-1]

とすれば最後のParagraphが取得できます。

[スポンサードリンク]

Home » Python » python-docxの使い方 » python-docxを使ってWord文書のパラグラフ(段落)を取得する

「python-docxの使い方」の記事一覧

検索


Copyright © インストラクターのネタ帳 All Rights Reserved.

.