html形式のファイルとしてドキュメント内のテーブルのみを抽出し、ドキュメントが正しく複数のテーブル、ページテーブルから抽出することができ、現在gemini-2.0-flash-expの効果に適合しています。
原文
画像から表の内容を認識して抽出し、HTMLタグを使用して表の元の構造を再現することが課題です。このタスクでは、細部に注意を払い、表のレイアウトを正確に再現する必要があります。 画像を注意深く分析し、表の構造を特定する。 行 と列、結合されたセル、各セルの内容。 表の内容を抽出するためのガイドライン: 1. 1.表のセル内のすべてのテキストを特定する。 2.特別な書式(太字テキスト、異なるフォントサイズなど)に注意する。 3.セルの結合に注意する(水平と垂直の両方)。 4.ヘッダーの行や列を確認する。 以下のHTMLタグを使用して、表の構造を再現する。 -以下のHTMLタグを使って、表の構造を再現してください。 <table> テーブル全体 - <tr> テーブル行用 -テーブル行用 <th> ヘッダーセル用 - <td> 通常のデータ・セル用 - 複数の列にまたがるセルにはcolspan属性を使う。 - 複数の行にまたがるセルにはrowspan属性を使う 再作成したテーブル構造をコード・ブロック内に出力します。 出力は次のようになります。この場合、最初に``html記法'、最後に``を使用します。 html <table> <tr> <th>ヘッダー1</th> <th>ヘッダー2</th> </tr> <tr> <td>データ1</td> <td>データ2</td> </tr> </table> `` 結合されたセルや特殊な書式を含め、元の表の構造を維持するようにしてください。 で可能な限り正確かつ完全に再現してください。レクリエーションはできるだけ正確かつ完全に行うこと。 表を再作成したら、すべてのコンテンツが正確に抽出され、HTML構造が元の表レイアウトを正しく表していることを最終確認します。元のテーブル・レイアウトを再現してください。 注意:グラフィック情報は無視すること。 Base64は出力できません。 今すぐ表の解析と再現を開始する。
翻訳
画像内の表の内容を識別して抽出し、HTMLタグを使って表の元の構造を再現する必要があります。この作業には、細部への注意と表のレイアウトの正確な再現が必要です。 画像を注意深く分析し、行や列の数、結合されたセル、各セルの内容など、表の構造を特定します。 表の内容を抽出するためのガイドライン 1. すべての表のセル内のテキストを特定する。 2. 特別な書式設定(太字テキスト、拡大縮小の異なるフォントなど)があれば注意する。 3. セルの結合に注意する(水平と垂直の両方)。 4. ヘッダーの行や列の存在を確認する。 以下のHTMLタグを使用して、表の構造を再構築する: - 使用方法 <table> はテーブル全体を表します。 - 使用方法 <tr> テーブル行を示す。 - 使用方法 <th> ヘッダーセルを示す。 - 使用 <td> 通常のデータ・セルを示す。 - 複数の列にまたがるセルには、colspanプロパティを使用します。 - 複数の行にまたがるセルには、rowspanプロパティを使用します。 再構築された表構造をコードブロックに出力し、ブロックの最初に ``html`` とラベルを付け、最後に ``` で閉じます。出力は以下のような書式でなければならない: html <table> <tr> <th>ヘッダー1</th> <th>ヘッダー2</th> </tr> <tr> <td>データ1</td> <td>データ2</td> </tr> </table> `` 結合されたセルや特殊な書式を含め、表の元の構造を保持していることを確認する。可能な限り正確かつ完全に再構築する。 テーブルを再構築した後、最終チェックを行い、すべてのコンテンツが正確に抽出され、HTML構造が元のテーブルレイアウトを正しく表していることを確認する。 注:グラフィック情報は無視する。Base64を出力しない。 次にフォームの分析と再構築を開始する。
ほら
キュー・ワードの文を削除する: 注記:グラフィック情報は無視すること。 Base64は出力できない。
この場合、大きなモデルが画像内のすべての情報を復元する確率がある。