|
## 网站描述
|
|
## 网站描述
|
|
|
|
[豆瓣](https://www.douban.com)是一个社区网站,由用户提供关于书籍、电影、音乐等实体的描述和评论。本实验的目标是[书籍库](https://book.douban.com)评论数据的采集。
|
|
|
|
|
|
## 采集需求
|
|
## 采集需求
|
|
|
|
获得实体的名称,实体下面短评的评论人、评论、评论星数、觉得有用的人数;书评评论人,书评内容,书评的点赞数与评论。
|
|
|
|
|
|
## 数据格式
|
|
## 数据格式
|
|
采集得到的数据要求为`json`格式,要求的字段及描述如下:
|
|
采集得到的数据要求为`json`格式,要求的字段及描述如下:
|
|
```javascript
|
|
```javascript
|
|
[
|
|
[
|
|
{
|
|
{
|
|
bookName: "...", // 视频名称
|
|
bookName: "...", // 书籍名称
|
|
bookURL: "...", // 视频url
|
|
bookURL: "...", // 书籍url
|
|
bookType:”…”, //视频类型
|
|
bookType: "…", // 书籍类型
|
|
shortRemark:[ // 视频内的短评
|
|
shortRemark:[ // 书籍内的短评
|
|
{
|
|
{
|
|
id: "…" // 短评人
|
|
id: "…" // 短评人
|
|
content: "xxxxxx", // 评论内容
|
|
content: "xxxxxx", // 评论内容
|
|
starNumber: "5", // 标星数
|
|
starNumber: "5", // 标星数
|
|
usefulNumber: “177”, // 觉得有用的人数
|
|
usefulNumber: "177", // 觉得有用的人数
|
|
},
|
|
},
|
|
...
|
|
...
|
|
],
|
|
],
|
|
longRemark:[ // 视频内的长评
|
|
longRemark:[ // 书籍内的长评
|
|
{
|
|
{
|
|
id: "…" // 评论人
|
|
id: "…" // 评论人
|
|
content: "xxxxxx", // 评论内容
|
|
content: "xxxxxx", // 评论内容
|
|
starNumber: "5", // 标星数
|
|
starNumber: "5", // 标星数
|
|
usefulNumber: “177/9”, // 觉得有用的人数/觉得没用的人数
|
|
usefulNumber: "177/9", // 觉得有用的人数/觉得没用的人数
|
|
},
|
|
},
|
|
...
|
|
...
|
|
]
|
|
]
|
... | @@ -32,3 +34,6 @@ |
... | @@ -32,3 +34,6 @@ |
|
...
|
|
...
|
|
]
|
|
]
|
|
```
|
|
```
|
|
|
|
|
|
|
|
## 提示
|
|
|
|
?? |
|
|
|
\ No newline at end of file |