使用beautiful soup 和 python 获取html meta属性的 keywords, description

错误方法

最早使用下面的方法,一直获取不成功.

1
2
title = soup.find("meta", name="description")
title = soup.find("meta", name="keywords")

正确方法

在beautiful soup中应该使用 property=<…> 而不是 name=<…> 来获取元标记。 以下是获得所需内容的最终代码:

1
2
3
4
5
#获取description
md_desc = soup.find('head').find('meta', attrs={'name': 'description'})['content']

#获取keywords
md_keywords = soup.find('head').find('meta', attrs={'name': 'keywords'})['content']

另一种方法

通过2次find方法

1
2
3
meta = soup.findall("meta")
title = meta.find(name="description")
image = meta.find(name="keywords")
记录并分享
Built with Hugo
主题 StackJimmy 设计