Поиск в статьях

Используем библиотеку JSOUP на примере бэкапа цитат из bash.im



JSOUP - это Java-библиотека для работы с документами HTML. Она обеспечивает очень удобный API для извлечения и манипулирования данными, используя DOM, CSS, и JQuery-подобные методы. Последняя версия этой библиотеки - 1.8.2, скачать можно с официального сайта. Там же можно найти примеры программ, и документацию. Прежде чем приступить к парсингу страницы, необходимо получить её html-код и изучит

Граббер сайта на OwnLang за пять минут



с данные. [img=ownlang_grabber_1.png]HTML-код страницы[/img] Как видно, краткая информация о библиотеке находится в блоке <div class="project-info">. На странице https://try.jsoup.org/ можно попробовать получить данные онлайн и подобрать селекторы. Импортируем страницу: [img=ownlang_grabber_2.png]Получение страницы[/img] Получаем: Список библиотек: .project-info
Всего: 2


Пожертвования

Аноним2800 р.
Freddy1700 р.
NaruTrey800 р.
vlavolk522 р.
mr-demiurg200 р.
  © aNNiMON (Melnik Software)
 
Яндекс.Метрика