🌐 Browser Skill
Описание
Браузерная автоматизация через Playwright для парсинга сайтов и скриншотов.
⚠️ Ограничения
- •Avito — заблокирован для IP Бали
- •Google Search — может быть капча
- •Рекомендуется использовать
web_searchskill вместо парсинга Google
Функции
open_page(url: str) -> dict
Открыть страницу и получить её содержимое.
Возвращает:
python
{
"success": bool,
"title": str,
"text": str, # Текстовое содержимое
"html": str, # HTML (опционально)
"screenshot": str # Путь к скриншоту
}
screenshot(url: str, name: str) -> str
Сделать скриншот страницы.
search_google(query: str) -> list
Поиск в Google (может быть капча!).
search_yandex(query: str) -> list
Поиск в Яндексе.
get_text(url: str) -> str
Получить только текст страницы.
Пример использования
python
from skills.browser.scripts.main import BrowserAgent
import asyncio
async def main():
browser = BrowserAgent()
await browser.start()
# Открыть страницу
result = await browser.open_page("https://example.com")
print(result["title"])
print(result["text"][:500])
# Скриншот
path = await browser.screenshot("https://example.com", "example")
print(f"Скриншот: {path}")
await browser.stop()
asyncio.run(main())
Headless режим
По умолчанию браузер работает в headless режиме (без GUI).
Для отладки можно включить GUI: await browser.start(headless=False)
Скриншоты
Сохраняются в ~/animara/screenshots/
Когда использовать
- •Парсинг конкретного сайта
- •Получение данных с динамических страниц (JS)
- •Скриншоты для отчётов
- •Заполнение форм
Когда НЕ использовать
- •Простой поиск информации → используй
web_search - •Avito, Циан → заблокированы
- •Массовый парсинг → риск бана