网络科技

    今日:28| 主题:301130
收藏本版
互联网、科技极客的综合动态。

[其他] 一个更酷的选电影方法(附豆瓣Top250电影数据Excel)

[复制链接]
fpwx0sOl 发表于 2016-11-27 21:47:26
211 2

一个更酷的选电影方法(附豆瓣Top250电影数据Excel)

一个更酷的选电影方法(附豆瓣Top250电影数据Excel)

  很多人选电影,常常会去豆瓣电影找,有各种排行榜、打分和风格分类,已经比较方便了。
  但是对于一个网站的设计者来说,网站内容的组织方法是有限的。
  按评分、按风格、按国家、按上映时间、按榜单等等维度组织就差不多了。
  可是如果你有更个性化的需求就很难满足了。
  比如:
  
       
  • 找到2015年豆瓣打分人数超过1万人,豆瓣评分高于8.8分的科幻电影。
       
  • 找到李安作品中1万人以上打分,豆瓣评分8.5分以上的电影。
       
  • 找到梁朝伟参演的1万人以上打分,豆瓣评分大于8.5分以上的电影。
      
  其实还有很多组织维度,只要你通过编程采集获取这些数据并格式化存储,以后就可以随心所欲的找电影了,上面三个例子根本不是问题。
   比如我采集了  豆瓣电影Top250   的所有电影信息到数据库中。
  比如我想查看梁朝伟参演的、豆瓣8.5分以上,打分人数超过1万人的电影名称和简介等信息。
  只需要一个查询语句就可以得到:
  select fullname,summary,rate_num,votes from douban_new where rate_num>8.5 and votes>10000 and stars like “%梁朝伟%” \G
     结果如下:
   

一个更酷的选电影方法(附豆瓣Top250电影数据Excel)

一个更酷的选电影方法(附豆瓣Top250电影数据Excel)
       为了实现更加复杂的组合查询,采集内容时的数据格式化是非常重要的。
   

一个更酷的选电影方法(附豆瓣Top250电影数据Excel)

一个更酷的选电影方法(附豆瓣Top250电影数据Excel)
    比如这个数据中采集了片名(和别名)、导演、演员、简介、上映时间、片长、打分人数、评分等等数据。
  数据越多、越格式化越好,查询起来就越方便和准确。
  可能一些朋友不太会用数据库,所以我把采集到的豆瓣电影Top250数据导出了Excel格式。
  靠Excel的筛选和查找功能可以实现一样的效果。
  豆瓣Top250电影格式化数据下载:

    https:// pan.baidu.com/s/1jHAfql S   
  下一步更好的目标是采集全部的豆瓣电影数据,甚至包括下载地址(磁力链)。
  这样就可以贴到115网盘,在线看了。
  目前找到对应电影名字的话,推荐使用哔哩哔哩或其他视频软件找电影播放。
  --------
  欢迎大家加我微信交流:vista8
   交流论坛:  http://www. xiaojiaoluo.com   
  以后计划开课免费教大家如何做数据抓取和格式化处理。
  ​
herowzb 发表于 2016-11-27 23:24:12
默默的闪走 2016-11-27的天气真不好
回复 支持 反对

使用道具 举报

ghd1453925863 发表于 2016-11-27 23:32:34
介是神马?!!
回复 支持 反对

使用道具 举报

我要投稿

推荐阅读


回页顶回复上一篇下一篇回列表
手机版/c.CoLaBug.com ( 粤ICP备05003221号 | 粤公网安备 44010402000842号 )

© 2001-2017 Comsenz Inc.

返回顶部 返回列表