4468  Kalter [Off]
 Homo homini penis est.
(26.05.2015 / 17:42)
Naik, лол, а ты точно внимательно прочёл статейку? Как раз JSOUP и используется.
116  aRiGaTo [Off]
 don't tread on me
(26.05.2015 / 13:49)
web_demon, неправильный админ какой-то
275  Naik [Off]
(26.05.2015 / 13:22)
Напрример
  1. final Document bash = Jsoup.connect("http://www.bash.im/").get();
  2. final List<Element> elms = bash.select(".quote");

А если нормально знать css то наверняка можно вообще обойтись одним запросом
275  Naik [Off]
(26.05.2015 / 13:19)
Зачем перебирать все дивы, всякие стрим апи, если можно все сделать с помощью jsoup?
2  web_demon (SV!) [Off]
(26.05.2015 / 12:22)
aNNiMON, ну если парсить регулярками, то ничего пропускать и не надо. Ну и как по мне, чем запутанней стнуктура, тем лучше. Мало какому админу понравится что его сайт парсят.
Изм. web_demon (26.05 / 12:22) (1)
1  aNNiMON (SV!) [Off]
 let live
(26.05.2015 / 12:06)
web_demon, на самом деле не очень. Достаточно открыть форум, чтобы в этом убедиться. table, нет единых id/class с семантическим представлением. Например, название темы у нас .phrd>b, хотя можно было отдельный id повесить #topicname. Дата написания поста: .posttable>.post_top_l>.gray.
Комментарии вот на этой странице - .class1|.class2>(тут надо пропустить table и .gray, чтобы получить содержимое комментария).
2  web_demon (SV!) [Off]
(26.05.2015 / 11:55)
Ксакеп, тут вообще отличная разметка, можно написать один единственный парсер который разберет и веб и вап, благо различий - табличка и стили.
1  aNNiMON (SV!) [Off]
 let live
(26.05.2015 / 09:46)
Годнота!
3789  vl@volk [Off]
 знает толк
(26.05.2015 / 09:02)
На примере о JSOUP - всё пучком
3254  Ксакеп (FMod) [Off]
(26.05.2015 / 08:38)
Задача тривиальная, поскольку на баше отличная разметка. Чего, например, не скажешь об http://annimon.com/
Всего: 20
<< 1 2
К записи
Java
Категории

Мы в соцсетях

tw tg yt gt