Skip to content
GitLab
  • Menu
Projects Groups Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
  • Sign in / Register
  • D data-specification
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Issues 0
    • Issues 0
    • List
    • Boards
    • Service Desk
    • Milestones
  • Packages & Registries
    • Packages & Registries
    • Package Registry
    • Infrastructure Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Create a new issue
  • Issue Boards
Collapse sidebar
  • Yu Yin
  • data-specification
  • Wiki
  • 豆瓣 影评

豆瓣 影评 · Changes

Page history
Create 豆瓣 影评 authored Oct 23, 2019 by Le Dai's avatar Le Dai
Show whitespace changes
Inline Side-by-side
豆瓣-影评.md 0 → 100644
View page @ 74c10f0f
## 网站描述
[豆瓣](https://www.douban.com)是一个社区网站,由用户提供关于书籍、电影、音乐等实体的描述和评论。本实验的目标是[豆瓣电影](https://movie.douban.com)评论数据的采集。
## 采集需求
获得实体的名称,实体下面短评的评论人、评论、评论星数、觉得有用的人数;影评评论人,影评内容,影评的点赞数与评论。
## 数据格式
采集得到的数据要求为`json`格式,要求的字段及描述如下:
```javascript
[
{
"movieName": "...", // 视频名称
"movieURL": "...", // 视频url
"movieType": "…", // 视频类型
"moviePoster": [ // 视频海报
"http://...", // 海报url
...
],
"movieShower": [ //宣传视频
"http://...", //宣传视频url
...
],
"shortRemark":[ // 视频内的短评
{
"id": "…" // 短评人
"content": "xxxxxx", // 评论内容
"starNumber": "5", // 标星数
"usefulNumber": "177", // 觉得有用的人数
},
...
],
"longRemark":[ // 视频内的长评
{
"id": "…" // 评论人
"content": "xxxxxx", // 评论内容
"starNumber": "5", // 标星数
"usefulNumber": "177/9", // 觉得有用的人数/觉得没用的人数
},
...
]
},
...
]
```
## 评分标准
* 采集到豆瓣电影top 250榜单中全部电影的数据
* 采集到豆瓣上所有电影的url
## 提示
??
\ No newline at end of file
Clone repository
  • 39健康网 手术
  • 39健康网 检查
  • 39健康网 疾病
  • 39健康网 症状
  • 39健康网 药品
  • Coursera 视频间习题2
  • KDD 接收论文信息
  • LeetCode 中文讨论
  • LeetCode 中文试题
  • LeetCode 讨论
  • LeetCode 试题
  • Leetcode 题解
  • coursera
  • Home
  • 中国裁判文书网
View All Pages