使用beautiful soup 和 python 獲取html meta屬性的 keywords, description

錯誤方法

最早使用下面的方法,一直獲取不成功.

1
2
title = soup.find("meta", name="description")
title = soup.find("meta", name="keywords")

正確方法

在beautiful soup中應該使用 property=<…> 而不是 name=<…> 來獲取元標記。以下是獲得所需內容的最終代碼:

1
2
3
4
5
#獲取description
md_desc = soup.find('head').find('meta', attrs={'name': 'description'})['content']

#獲取keywords
md_keywords = soup.find('head').find('meta', attrs={'name': 'keywords'})['content']

另一種方法

通過2次find方法

1
2
3
meta = soup.findall("meta")
title = meta.find(name="description")
image = meta.find(name="keywords")
记录并分享
Built with Hugo
Theme Stack designed by Jimmy