1
0
Code Issues Pull Requests Projects Releases Wiki Activity GitHub Gitee
tools/netease_music/todo.txt

56 lines
3.0 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

cd C:\Users\Coz\Desktop\tools\
cd /www/neteasemusic/tools
node index --utils song --min 1800000000 --max 2000000000 --order DESC #
node index --utils song --min 1290000000 --max 1500000000 --order DESC #
node index --utils song --min 400000000 --max 1000000000 --order ASC #
node index --utils song --min 0 --max 400000000 --order ASC #
#############################################################################################
node index --utils album --min 134000000 --max 160000000 #
node index --utils album --min 0 --max 134000000 #
#############################################################################################
node index --utils artist #
#############################################################################################
node index --utils comment --min 1800000000 --max 2000000000 --order DESC #
node index --utils comment --min 1290000000 --max 1500000000 --order DESC #
node index --utils comment --min 400000000 --max 1000000000 --order ASC #
node index --utils comment --min 0 --max 400000000 --order ASC #
#############################################################################################
node index --utils lyric --min 1800000000 --max 2000000000 #
node index --utils lyric --min 400000000 --max 1000000000 #
node index --utils lyric --min 0 --max 400000000 #
#############################################################################################
node index --utils playlist #
思路:
通过一首歌查出对应的artist和album然后顺藤摸瓜查出网易云的其他song, album, artist, lyric, comment等
插入rel表的时候同时插入 wait_check_xx 表,然后后续检查这个表,如果不存在,那么就插入对应的 wait_fetch_xxx 表
之后查出 wait_fetch_xxx 表,进行数据拉取,形成闭环
后期:
歌单定时更新rel表中添加一个del字段先将歌单下面的全部置为删除状态再插入的时候把已有歌曲的标记重新修改为正常状态
评论的更新
爬取歌单playlist功能需要更新
被删除的aritst和album回头再通过其他表中的数据反查回来
说明:
song表中data_version=1的音乐是第一次爬取的时候存在但是后面再爬取时不存在的音乐
后续分区(不能在现有表上修改,只能重新查出数据到新表)
alter table song add partition (
PARTITION p1 VALUES LESS THAN ( 50000000),
PARTITION p2 VALUES LESS THAN (1000000000),
PARTITION p3 VALUES LESS THAN (1500000000),
PARTITION p4 VALUES LESS THAN (2000000000),
PARTITION p5 VALUES LESS THAN MAXVALUE
);