Skip to content
GitLab
  • Menu
Projects Groups Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
  • Sign in / Register
  • D data-specification
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Issues 0
    • Issues 0
    • List
    • Boards
    • Service Desk
    • Milestones
  • Packages & Registries
    • Packages & Registries
    • Package Registry
    • Infrastructure Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Create a new issue
  • Issue Boards
Collapse sidebar
  • Yu Yin
  • data-specification
  • Wiki
  • 优酷弹幕

优酷弹幕 · Changes

Page history
Create 优酷弹幕 authored Oct 22, 2019 by Yu Yin's avatar Yu Yin
Hide whitespace changes
Inline Side-by-side
优酷弹幕.md 0 → 100644
View page @ fd55134a
# 优酷弹幕采集需求
## 网站描述
[优酷视频](https://www.youku.com)是阿里巴巴文化娱乐集团下的互联网视频平台,其内容体系包含电视剧、 综艺、 电影、 动漫这四大头部内容矩阵。在这些视频内容的不同时间点,用户都可以通过弹幕的方式进行评论。本实验的目标是对视频弹幕进行采集。
以下是一个电影中某个时间点的弹幕评论:
![image](/uploads/-/system/personal_snippet/4/6db09eb3fe58ff40cb7e84ad89e9834d/image.png)
## 数据格式
采集得到的数据要求为`json`格式,要求的字段及描述如下:
```javascript
[
{
"title": "霸王别姬", // 电影/电视剧/动漫名
"category": "movie", // 类别(movie/series/anime)
"url": "https://v.youku..." // 电影/电视剧/动漫URL
"danmu": [ // 弹幕列表
{
"uid": 1044158391, // 用户id
"content": "这演技太好了", // 弹幕内容
"playat": 2065749, // 弹幕在视频中位置(毫秒)
"createtime": 1561180986000 // 弹幕创建的时间戳
},
...
]
},
...
]
```
## 评分标准
* 从优酷视频的电影/电视剧/动漫库中采集100个视频的所有弹幕数据(以上可以给一分)
* 在上述基础上收集到优酷视频所有电影、电视剧、动漫的URL(以上可以给两分)
## 提示
* 收集页面向服务器发送的请求,从中分析哪些请求可用于直接获取包含所需域的数据。
Clone repository
  • 39健康网 手术
  • 39健康网 检查
  • 39健康网 疾病
  • 39健康网 症状
  • 39健康网 药品
  • Coursera 视频间习题2
  • KDD 接收论文信息
  • LeetCode 中文讨论
  • LeetCode 中文试题
  • LeetCode 讨论
  • LeetCode 试题
  • Leetcode 题解
  • coursera
  • Home
  • 中国裁判文书网
View All Pages