main.py 667 B

1234567891011121314151617181920212223242526272829
  1. import requests
  2. from bs4 import BeautifulSoup
  3. def get_html(url): # получение dom-html
  4. res = requests.get(url)
  5. # print(dir(res.status_code))
  6. # print(res.status_code)
  7. # print(res.text)
  8. return res.text
  9. def get_data(html): # получение данных из html
  10. soup = BeautifulSoup(html, 'lxml') # на вход html и название парсера
  11. header_h1 = soup.find(
  12. 'div', id='home-welcome').find('header').find('h1').text
  13. return header_h1
  14. def main():
  15. url = 'https://wordpress.org/'
  16. html = get_html(url)
  17. result = get_data(html)
  18. print(result)
  19. if __name__ == '__main__':
  20. main()