超简单,只需4步爬取女神微博评论

作者:应用开发 来源:系统运维 浏览: 【】 发布时间:2025-11-04 07:34:53 评论数:
超简单,只需4步爬取女神微博评论
复制"""  爬取微博评论,超简单保存到数据库  https://m.weibo.cn/api/comments/show?只需id=4477013081328252&page=50  该接口能获取微博的前50页数据,每页10条,步爬博评 id 是取女某条微博的WordPress模板id  https://m.weibo.cn/comments/hotflow?mid=4477013081328252&max_id=330569188932643&max_id_type=0  此接口能爬到所有评论信息, mid 是神微某条微博id, max_id 是超简单上一个请求返回的企商汇分页参数, max_id_type 固定为0就好  """  from pymongo import MongoClient  import requests  import time __author__ = liuzhijun headers = {      "Host": "m.weibo.cn",只需      "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) "                   "Version/9.0 Mobile/13B143 Safari/601.1",      "Cookie": "xxxxx" # 这里将浏览器的cookie复制过来进行了。 }  client = MongoClient(mongodb://localhost:27017/)  db = client[weibo]  def main(mid,步爬博评 max_id):      """      :param mid: 某条微博id      :param max_id: 分页参数      :return:      """      url = "https://m.weibo.cn/comments/hotflow?max_id_type=0"     params = {"mid": mid}      if max_id:          params[max_id] = max_id      res = requests.get(url, params=params, headers=headers)      print(res.content)      result = res.json()      max_id = result.get("data").get("max_id")      data = result.get(data).get(data)      for item in data:          db[comment].insert_one(item)      if max_id:          time.sleep(1)          main(mid, max_id)  if __name__ == __main__:      main("4477013081328252", None)  1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.48.49.50.51.

最近更新