Теперь есть одна интересная задача, решить которую предлагаю уже вам. Ответов я не знаю.
Анализ логов
В файле
log.txt хранятся идентификаторы запросов
QueryID и ссылок
URLID, по которым кликали пользователи поисковой системы. Ваша задача для каждого запроса, указанного в файле
queries.txt, определить:
1. ClickNum - суммарное количество кликов на различные URLID запроса FavouriteURLID
2. URLID, который в данном запросе пользовался наибольшей популярностью у пользователей и
FavouriteURLClickNum – количество кликов по этому URLID. Если данный запрос отсутствует в логах, положите FavouriteURLID=-1, FavouriteURLClickNum = -1. Если в данном запросе несколько популярных URL, укажите наибольший URLID.
На каждой строчке файла
output.txt через пробел укажите:
QueryID ClickNum FavouriteURLID FavouriteURLClickNumВ файле
output.txt запросы QueryID должны идти в том же порядке, что и в файле queries.txt.
Пример
# log.txt
# QueryID URLID
45 1832
34 2839
45 1830
12 2031
45 1832
45 1830
12 2031
45 1832
12 7002
33 8033
45 1830
# queries.txt
12
10
45
34
20
# output.txt
12 3 2031 2
10 0 -1 -1
45 6 1832 3
34 1 2839 1
20 0 -1 -1
У меня на компьютере лежит файл в 1Мб, и файл в 1Гб и в 8Гб. Как напишите готовую программу, которая будет выплевывать результат - залейте сюда, я протестирую. К тому же желательно предоставить несколько алгоритмов. Буду ждать. Победителю 1000 монет