Парсер поисковых запросов

  1. import urllib
  2. import urlparse
  3.  
  4. PARSE_SEARCH_URL = {
  5.     'google': 'q',
  6.     'yandex': 'text',
  7.     'mail': 'q',
  8.     'rambler': 'query',
  9.     'yahoo': 'p'
  10.  
  11. }
  12.  
  13. def get_search_query(url):
  14.     u = urlparse.urlparse(url)
  15.     for search_engine, query_key in PARSE_SEARCH_URL.items():
  16.         if not search_engine in u.netloc:
  17.             continue
  18.  
  19.         query = urlparse.parse_qs(u.query).get(query_key)
  20.         if not query:
  21.             break
  22.  
  23.         if isinstance(query, list):
  24.             query = query[0]
  25.  
  26.         return urllib.unquote(query).decode('utf8')
пепедаем url в виде строки, и если это поисковик, то получаем запрос поисковика, иначе None

Реклама

Мы в соцсетях

tw tg yt gt