動作検証バージョン:64bit Windows 10 Pro + + Python 3.8.3 + python-docx 0.8.10
「python-docx パラグラフ取得」
という検索キーワードでアクセスがありました。
[スポンサードリンク]
python-docxを使ってパラグラフ(段落)を取得するサンプルスクリプト
Cドライブtempフォルダーに、複数の段落が存在するsample.docxを用意しておいてから、以下のスクリプトを実行してください。
import docx
print(par.text)
doc = docx.Document(r'c:\temp\sample.docx')
print(par.text)
1つ目のパラグラフ(段落)の文字列が出力されます。
Document.paragraphsでParagraphが要素のリストを取得できる
python-docxでは、Documentオブジェクトに用意されているparagraphs属性を使うと、Word文書の段落を表すParagraphオブジェクトを要素として含むリストが取得できます。
リストの1つ目の要素である、1つ目の段落を表すParagraphを取得しているのが、
par = doc.paragraphs[0]
です。
「python-docx パラグラフ取得」
とのことですが、取得しただけでは何が起きているかわからないので、Paragraph.text属性で取得できるその段落の文字列を出力しています。
print(par.text)
Document.paragraphsで取得できるのはリスト
Document.paragraphsで取得できるのはリストですから、
par = doc.paragraphs[0]
を
par = doc.paragraphs[1]
にすれば、2つ目の段落を表すParagraphが取得でき、
par = doc.paragraphs[-1]
とすれば最後のParagraphが取得できます。
[スポンサードリンク]
Home » Python » python-docxの使い方 » python-docxを使ってWord文書のパラグラフ(段落)を取得する