PDFから読み込み

カテゴリ:データサイエンス

まずインストールを行う。

pip install tabula-py JPype1

以下のようにして取得できる。

import pandas as pd
import tabula

dfs = tabula.read_pdf('ファイル名', lattice=True, pages = 'ページ番号')

# このページの最初の表
df = dfs[0]
戻る