|
|
|
## 网站描述
|
|
|
|
[豆瓣](https://www.douban.com)是一个社区网站,由用户提供关于书籍、电影、音乐等实体的描述和评论。本实验的目标是[豆瓣电影](https://movie.douban.com)评论数据的采集。
|
|
|
|
|
|
|
|
## 采集需求
|
|
|
|
获得实体的名称,实体下面短评的评论人、评论、评论星数、觉得有用的人数;影评评论人,影评内容,影评的点赞数与评论。
|
|
|
|
|
|
|
|
## 数据格式
|
|
|
|
采集得到的数据要求为`json`格式,要求的字段及描述如下:
|
|
|
|
```javascript
|
|
|
|
[
|
|
|
|
{
|
|
|
|
"movieName": "...", // 视频名称
|
|
|
|
"movieURL": "...", // 视频url
|
|
|
|
"movieType": "…", // 视频类型
|
|
|
|
"moviePoster": [ // 视频海报
|
|
|
|
"http://...", // 海报url
|
|
|
|
...
|
|
|
|
],
|
|
|
|
"movieShower": [ //宣传视频
|
|
|
|
"http://...", //宣传视频url
|
|
|
|
...
|
|
|
|
],
|
|
|
|
|
|
|
|
"shortRemark":[ // 视频内的短评
|
|
|
|
{
|
|
|
|
"id": "…" // 短评人
|
|
|
|
"content": "xxxxxx", // 评论内容
|
|
|
|
"starNumber": "5", // 标星数
|
|
|
|
"usefulNumber": "177", // 觉得有用的人数
|
|
|
|
},
|
|
|
|
...
|
|
|
|
],
|
|
|
|
"longRemark":[ // 视频内的长评
|
|
|
|
{
|
|
|
|
"id": "…" // 评论人
|
|
|
|
"content": "xxxxxx", // 评论内容
|
|
|
|
"starNumber": "5", // 标星数
|
|
|
|
"usefulNumber": "177/9", // 觉得有用的人数/觉得没用的人数
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
```
|
|
|
|
|
|
|
|
## 评分标准
|
|
|
|
* 采集到豆瓣电影top 250榜单中全部电影的数据
|
|
|
|
* 采集到豆瓣上所有电影的url
|
|
|
|
|
|
|
|
## 提示
|
|
|
|
?? |
|
|
|
\ No newline at end of file |