1234567891011121314151617181920212223242526272829 |
- import requests
- from bs4 import BeautifulSoup
- def get_html(url): # получение dom-html
- res = requests.get(url)
- # print(dir(res.status_code))
- # print(res.status_code)
- # print(res.text)
- return res.text
- def get_data(html): # получение данных из html
- soup = BeautifulSoup(html, 'lxml') # на вход html и название парсера
- header_h1 = soup.find(
- 'div', id='home-welcome').find('header').find('h1').text
- return header_h1
- def main():
- url = 'https://wordpress.org/'
- html = get_html(url)
- result = get_data(html)
- print(result)
- if __name__ == '__main__':
- main()
|