AgentSkillsCN

Browser

浏览器

SKILL.md

🌐 Browser Skill

Описание

Браузерная автоматизация через Playwright для парсинга сайтов и скриншотов.

⚠️ Ограничения

  • Avito — заблокирован для IP Бали
  • Google Search — может быть капча
  • Рекомендуется использовать web_search skill вместо парсинга Google

Функции

open_page(url: str) -> dict

Открыть страницу и получить её содержимое.

Возвращает:

python
{
    "success": bool,
    "title": str,
    "text": str,      # Текстовое содержимое
    "html": str,      # HTML (опционально)
    "screenshot": str # Путь к скриншоту
}

screenshot(url: str, name: str) -> str

Сделать скриншот страницы.

search_google(query: str) -> list

Поиск в Google (может быть капча!).

search_yandex(query: str) -> list

Поиск в Яндексе.

get_text(url: str) -> str

Получить только текст страницы.

Пример использования

python
from skills.browser.scripts.main import BrowserAgent
import asyncio

async def main():
    browser = BrowserAgent()
    await browser.start()
    
    # Открыть страницу
    result = await browser.open_page("https://example.com")
    print(result["title"])
    print(result["text"][:500])
    
    # Скриншот
    path = await browser.screenshot("https://example.com", "example")
    print(f"Скриншот: {path}")
    
    await browser.stop()

asyncio.run(main())

Headless режим

По умолчанию браузер работает в headless режиме (без GUI). Для отладки можно включить GUI: await browser.start(headless=False)

Скриншоты

Сохраняются в ~/animara/screenshots/

Когда использовать

  • Парсинг конкретного сайта
  • Получение данных с динамических страниц (JS)
  • Скриншоты для отчётов
  • Заполнение форм

Когда НЕ использовать

  • Простой поиск информации → используй web_search
  • Avito, Циан → заблокированы
  • Массовый парсинг → риск бана