去年 (2024年)年末あたりから「browser-use」の文字がXのタイムラインに流れ出し、試したところなかなか面白かったので、今回ご紹介したい。一言で言えば「LLMとWebブラウザを使ったタスク処理」だが、一体何ができるか!?について、順に解説したい。
AI技術を応用して人の手で行っていた作業を自動化する流れはますます加速しており、特にウェブブラウザ上での操作を自動化するツールは多くのユーザーにとって有用そうです。しかしAI自動化ツールの多くはクラウドベースであるためAPIキーの取得といった煩雑な手 ...
Webブラウザを外部のプログラムから自由気ままに操作できてしまうと、それはセキュリティ的に好ましい状態ではない。そのため、デフォルトでは外部からWebブラウザを操作することはできないようになっている。 しかし、WebアプリケーションやWebページ ...