錯誤方法
最早使用下面的方法,一直獲取不成功.
1
2
|
title = soup.find("meta", name="description")
title = soup.find("meta", name="keywords")
|
正確方法
在beautiful soup中應該使用 property=<…> 而不是 name=<…> 來獲取元標記。以下是獲得所需內容的最終代碼:
1
2
3
4
5
|
#獲取description
md_desc = soup.find('head').find('meta', attrs={'name': 'description'})['content']
#獲取keywords
md_keywords = soup.find('head').find('meta', attrs={'name': 'keywords'})['content']
|
另一種方法
通過2次find方法
1
2
3
|
meta = soup.findall("meta")
title = meta.find(name="description")
image = meta.find(name="keywords")
|