「PDFからテーブルを抽出する」では、PDFファイルからテーブル部分を読み取り、DataTable形式で取得することができます。
PDFからテーブルを抽出する
data:image/s3,"s3://crabby-images/22c84/22c84f13dade7cb301bf9895387cd7d281312a12" alt="PowerAutomateDesktop pdfからテーブルを抽出する1"
PDFからテーブルを抽出するは、アクションペインのPDFから追加できます。
data:image/s3,"s3://crabby-images/d5ff2/d5ff25b1fe65701c0e6e8311c6c71ee269cb0e93" alt="PowerAutomateDesktop pdfからテーブルを抽出する2"
追加するとダイアログが表示されます。
全般
data:image/s3,"s3://crabby-images/d2330/d2330ea706417b2873b33369990e26da4d56d0f9" alt="PowerAutomateDesktop pdfからテーブルを抽出する3"
テーブルを読み取る対象となるPDFを指定します。ファイルの選択アイコンからファイルを選択すると、
data:image/s3,"s3://crabby-images/4b62a/4b62a5a35cf23abf55ee391084bd25ea7f28f421" alt="PowerAutomateDesktop pdfからテーブルを抽出する4"
パスが入力されます。パスは直接書いてもいいし、パスの一部に{x}から変数を使用することもできます。
抽出するページ
data:image/s3,"s3://crabby-images/405e9/405e9e6847ec838eb6e30e76f44b65585ada4867" alt="PowerAutomateDesktop pdfからテーブルを抽出する5"
テーブルを読むページを指定します。すべてでは全ページが対象となります。
data:image/s3,"s3://crabby-images/27af8/27af8259a7da497c9d2a304cc779912542d0ef66" alt="PowerAutomateDesktop PDFからテキストを抽出7"
単一では単一ページ番号で読み取るページを指定、
data:image/s3,"s3://crabby-images/3586f/3586f285ca93b6287220d4a83055a795f267bef7" alt="PowerAutomateDesktop PDFからテキストを抽出8"
範囲では開始ページ番号と終了ページ番号で読み取る範囲を指定することができます。
詳細
data:image/s3,"s3://crabby-images/d14e8/d14e8ffa92e8ac49ca7ed0424bbd0df476806bd4" alt="PowerAutomateDesktop pdfからテーブルを抽出する6"
詳細から、以下の設定が可能です。
パスワード
data:image/s3,"s3://crabby-images/955c8/955c823ce30f9fe07a8dd812aa4a2fa674e8b5d7" alt="PowerAutomateDesktop pdfからテーブルを抽出する7"
PDFがパスワードで保護されている場合、それを解除するためのパスワードを指定できます。
保護されてない場合は空欄でOKです。
保護されてない場合は空欄でOKです。
ページの余白を超えるテーブルをマージする
data:image/s3,"s3://crabby-images/2607e/2607e4fe5737ab935c782a154a946974f738bff5" alt="PowerAutomateDesktop pdfからテーブルを抽出する11"
マージ=結合。つまりページをまたいだテーブルをくっつけるか、分離して取得するかを指定できます。
最初の行に列名を含める
data:image/s3,"s3://crabby-images/bae20/bae20d1960974ff54b785b5228c2a866a6232b81" alt="PowerAutomateDesktop pdfからテーブルを抽出する12"
テーブルの一行目を見出し(列名)として扱うかどうかを指定できます。
生成された変数
data:image/s3,"s3://crabby-images/35d6c/35d6c71a171d020187f30649df9baa4f51796e31" alt="PowerAutomateDesktop pdfからテーブルを抽出する13"
変数の名前をクリックして変更可能です。{x}から別の変数に値を上書きすることもできます。
data:image/s3,"s3://crabby-images/c698b/c698b8362438fbb750f620e0131c9198b05b3ea9" alt="PowerAutomateDesktop pdfからテーブルを抽出する14"
スイッチをオフにすると変数が生成されなくなります。
エラー発生時
data:image/s3,"s3://crabby-images/6112c/6112c13be9530ca11195c3626182cfeced537157" alt="PowerAutomateDesktop pdfからテーブルを抽出する15"
エラー時の処理を設定できます。
data:image/s3,"s3://crabby-images/1552c/1552cd2db86adf51bb90883969ab68a773573df7" alt="PowerAutomateDesktop pdfからテーブルを抽出する16"
詳細では、PDFが存在しない、パスワードが無効、テーブルを抽出できない場合の対処を個別に指定できます。
実行例
data:image/s3,"s3://crabby-images/ad631/ad63106c29452b64e0d69af92192f871acf0dcf4" alt="PowerAutomateDesktop pdfからテーブルを抽出する9"
取得される変数(DataTable形式)は、塊としてはテキストとなり、
data:image/s3,"s3://crabby-images/fabb7/fabb74815b09b0038ea44302f237d8c17be84ff4" alt="PowerAutomateDesktop pdfからテーブルを抽出する8"
たとえば取得した変数をそのままExcelに書き込んでも、
data:image/s3,"s3://crabby-images/73d49/73d497ee900d7fce186952c306d5aca3d2ee6fd1" alt="PowerAutomateDesktop pdfからテーブルを抽出する17"
こんな感じのよくわからない状態になります。
data:image/s3,"s3://crabby-images/28bd4/28bd4ad5e5a5d33621c912b4d374deda182b0ae8" alt="PowerAutomateDesktop pdfからテーブルを抽出する10"
DataTableはこんな感じで中にデータが入っているのですが、
data:image/s3,"s3://crabby-images/d0cc0/d0cc0e10585e4e71ed6b8b78c0d55d7b74311cf1" alt="PowerAutomateDesktop pdfからテーブルを抽出する19"
PDFからテーブルを抽出するで取得したテーブルにはそれぞれ0,1,2…とナンバーが振られるので、(変数名)[0]でひとつめのテーブルを指定することができ、
data:image/s3,"s3://crabby-images/f56d9/f56d9a7457aee1947f3dfd21c1db9ab910695d69" alt="PowerAutomateDesktop pdfからテーブルを抽出する20"
さらにその後ろに.DataTableを付けると、テーブルの中身を取得することができます。
data:image/s3,"s3://crabby-images/9d717/9d717134b19c8af9199e2c5c54d711fc9c8047dc" alt="PowerAutomateDesktop pdfからテーブルを抽出する21"
なので仮にテーブルがひとつしかない場合、図のようにすれば、
data:image/s3,"s3://crabby-images/e00b6/e00b652a9e0122cb21e88ebe1ba4e649cfd3db7e" alt="PowerAutomateDesktop pdfからテーブルを抽出する22"
テーブルの中身を取得することができます。
Pdf.ExtractTablesFromPDF.ExtractTables PDFFile: $'''C:\\Users\\User\\Desktop\\sunagitsu_test\\sunagtisu.pdf''' MultiPageTables: True SetFirstRowAsHeader: False ExtractedPDFTables=> ExtractedPDFTables
Excel.LaunchExcel.LaunchUnderExistingProcess Visible: True Instance=> ExcelInstance
Excel.WriteToExcel.Write Instance: ExcelInstance Value: ExtractedPDFTables[0].DataTable
# [ControlRepository][PowerAutomateDesktop]
{
"ControlRepositorySymbols": [],
"ImageRepositorySymbol": {
"Name": "imgrepo",
"ImportMetadata": {},
"Repository": "{\r\n \"Folders\": [],\r\n \"Images\": [],\r\n \"Version\": 1\r\n}"
}
}
data:image/s3,"s3://crabby-images/77640/776402792df2c40009f94315b235fa10271e6ed3" alt=""
Microsoft Power Automate Desktop(PAD)アクション、使い方一覧
Power Automate Desktopの使い方を機能・分類別に参照できるまとめです。
コメント