はじめに
Apifyはフルスタックのウェブクローリングとデータ抽出プラットフォームで、あらゆるウェブサイトからのデータ抽出を自動化するための様々なツールとサービスを提供します。Apifyは複数のプログラミング言語とフレームワークをサポートし、様々なデータ収集と自動化のニーズに対応する豊富なAPIと統合オプションを提供します。
主流のワークフローツールに素早く統合でき、ナレッジベースを素早く構築できる最強のデータキャプチャツール。
機能一覧
- ウェブクローラーChromeを使って、あらゆるウェブページをクロールします。
- データ抽出JSON、XML、CSV、その他のフォーマットをサポートし、ウェブページから構造化データを抽出します。
- カスタム・クローラーアクターと呼ばれるカスタムデータ抽出ツールを構築し、公開します。
- API統合Zapier、Google Sheets、Slackなど、幅広いサードパーティサービスやツールとの統合。
- プロフェッショナル・サービス専門家チームによるカスタマイズされたウェブクローリングソリューションを提供します。
- オープンソースツールPuppeteer、Playwright、Seleniumなど、幅広いオープンソースツールやライブラリをサポート。
- データ処理大規模なデータ処理をサポートするために、データクリーニング、フォーマット変換、その他の機能を提供する。
- モニタリングとスケジューリングキャプチャ・タスクのリアルタイム・モニタリング、時間指定スケジューリングと自動化のサポート。
ヘルプの使用
インストールと使用
- 登録とログインアピファイ公式サイトにアクセスし、アカウントを登録してログインしてください。
- 選択ツールアピファイストアで既製のクローリングツールを見て、適切なものを選びましょう。
- キャプチャタスクを設定する::
- URLを入力クロールするウェブページのURLをツールの設定ページに入力します。
- クロールルールの設定再帰的クロール、データ抽出フィールドなど、必要に応じてクロールルールを設定します。
- タスクの実行Run "ボタンをクリックすると、キャプチャタスクが開始され、進捗状況と結果がリアルタイムで表示されます。
- 輸出データキャプチャー完了後、データをJSON、XML、CSVなどのフォーマットにエクスポートし、ローカルにダウンロードしたり、他のシステムに直接インポートすることができます。
- カスタム・クローラーの構築::
- アクターの作成アピファイプラットフォーム上に新しいアクターを作成し、カスタムクローリングとデータ抽出ロジックを記述します。
- テストとデバッグアピファイが提供する開発ツールとデバッグ機能を使用して、クロールロジックをテストし、エラーを修正します。
- パブリッシュ&ランアピファイストアへのアクターの公開、時間指定タスクの設定、または手動での実行。
- API統合::
- APIキーの取得アピファイAPIを呼び出すためのAPIキーをアカウント設定から取得します。
- APIの呼び出しAPI ドキュメントにあるサンプルコードを使用して、Apify API を独自のアプリケーションに統合し、データの抽出と処理を自動化します。
- プロフェッショナル・サービス::
- アピファイチームに連絡するカスタマイズされたソリューションが必要な場合は、アピファイのプロフェッショナルサービスチームにご連絡いただき、要件定義書をご提出ください。
- プロジェクトの実施アピファイチームは、データ抽出の正確さと効率を保証するために、要件に基づいてカスタマイズされたクローリングソリューションを設計し、実装します。
詳細な機能操作の流れ
- ウェブクローラー::
- グラバー・ツールの選択アピファイストアで "Web Scraper "ツールを選択します。
- キャプチャタスクを設定するクロールするウェブページのURLを入力し、再帰的クロールとデータ抽出のルールを設定します。
- キャプチャタスクの実行Run "ボタンをクリックすると、キャプチャーの進行状況と結果をリアルタイムで見ることができます。
- 輸出データキャプチャが完了したら、希望するフォーマットにデータをエクスポートします。
- データ抽出::
- データ抽出ツールを選択アピファイストアから適切なデータ抽出ツールを選択します。
- 抽出タスクの設定データを抽出したいウェブページのURLを入力し、データ抽出フィールドとルールを設定します。
- 抽出タスクの実行Run "ボタンをクリックすると、抽出の進行状況と結果をリアルタイムで見ることができます。
- 輸出データ抽出が完了したら、希望する形式にデータをエクスポートします。
- カスタム・クローラー::
- アクターの作成アピファイプラットフォーム上に新しいアクターを作成し、カスタムクローリングとデータ抽出ロジックを記述します。
- テストとデバッグアピファイが提供する開発ツールとデバッグ機能を使用して、クロールロジックをテストし、エラーを修正します。
- パブリッシュ&ランアピファイストアへのアクターの公開、時間指定タスクの設定、または手動での実行。
- API統合::
- APIキーの取得アピファイAPIを呼び出すためのAPIキーをアカウント設定から取得します。
- APIの呼び出しAPI ドキュメントにあるサンプルコードを使用して、Apify API を独自のアプリケーションに統合し、データの抽出と処理を自動化します。
- プロフェッショナル・サービス::
- アピファイチームに連絡するカスタマイズされたソリューションが必要な場合は、アピファイのプロフェッショナルサービスチームにご連絡いただき、要件定義書をご提出ください。
- プロジェクトの実施アピファイチームは、データ抽出の正確さと効率を保証するために、要件に基づいてカスタマイズされたクローリングソリューションを設計し、実装します。