|
|
|
## 网站描述
|
|
|
|
[豆瓣](https://www.douban.com)是一个社区网站,由用户提供关于书籍、电影、音乐等实体的描述和评论。本实验的目标是[豆瓣音乐](https://music.douban.com)评论数据的采集。
|
|
|
|
|
|
|
|
## 采集需求
|
|
|
|
获得实体的名称,实体下面短评的评论人、评论、评论星数、觉得有用的人数;乐评评论人,乐评内容,乐评的点赞数与评论。
|
|
|
|
|
|
|
|
## 数据格式
|
|
|
|
采集得到的数据要求为`json`格式,要求的字段及描述如下:
|
|
|
|
```javascript
|
|
|
|
[
|
|
|
|
{
|
|
|
|
"musicName": "...", // 音乐名称
|
|
|
|
"musicURL": "...", // 音乐url
|
|
|
|
"musicType": "...", // 音乐类型
|
|
|
|
"musicPoster": [ // 音乐海报
|
|
|
|
"http://...", // 海报url
|
|
|
|
...
|
|
|
|
],
|
|
|
|
|
|
|
|
"shortRemark":[ // 音乐内的短评
|
|
|
|
{
|
|
|
|
"id": "...", // 短评人
|
|
|
|
"content": "xxxxxx", // 评论内容
|
|
|
|
"starNumber": "5", // 标星数
|
|
|
|
"usefulNumber": "177", // 觉得有用的人数
|
|
|
|
},
|
|
|
|
...
|
|
|
|
],
|
|
|
|
"longRemark":[ // 音乐内的长评
|
|
|
|
{
|
|
|
|
"id": "...", // 评论人
|
|
|
|
"content": "xxxxxx", // 评论内容
|
|
|
|
"starNumber": "5", // 标星数
|
|
|
|
"usefulNumber": "177/9" // 觉得有用的人数/觉得没用的人数
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
```
|
|
|
|
|
|
|
|
## 评分标准
|
|
|
|
* 采集到豆瓣音乐top 250榜单中全部音乐的数据
|
|
|
|
* 采集到豆瓣上所有音乐的url
|
|
|
|
|
|
|
|
## 提示
|
|
|
|
?? |
|
|
|
\ No newline at end of file |