私たちが構築したものは何ですか?
カスタムウェブクローラー
ゴール
スペイン全土の多数のエネルギー会社の Web サイトから情報を収集するプロセスを自動化します。これにより、手動でのデータ収集が不要になり、クライアントの時間とリソースを大幅に節約できます。
チャレンジ
さまざまなエネルギー会社の多様な Web サイトを効率的にナビゲートできる強力なクローラーを開発します。課題には、さまざまな Web サイト構造、コンテンツ レイアウト、Web スクレイピングに対する潜在的なセキュリティ対策の処理が含まれます。
解決
このソリューションには、Typescript、Crawlee、Playwright などのテクノロジーを活用したカスタム構築の Web クローラーが含まれていました。
- クローリングロジック: クローラーは、さまざまなエネルギー会社のウェブサイトをナビゲートし、関連情報を識別して抽出するようにプログラムされていました。
- データ抽出: クローラーは、クライアントが定義した特定のデータポイントの抽出に重点を置いていました。
- データ統合: 抽出されたデータは、クライアントが簡単にアクセスして分析できるように、単一の整理されたCSVファイルにまとめられ、フォーマットされました。
スキル
Typescript, Crawlee, playwright
結果
クライアントは、ユーザーフレンドリーな形式 (CSV ファイル) で貴重なデータセットを受け取りました。このデータには、スペインのエネルギー企業数千社からの情報が含まれており、手動でのデータ収集に必要な時間と労力が不要になります。これにより、クライアントはデータをさらなる分析、市場調査、またはその他の戦略的な目的に活用できます。