ref: refactor before chekout
This commit is contained in:
@@ -0,0 +1,30 @@
|
||||
import pandas as pd
|
||||
from pathlib import Path
|
||||
|
||||
# Конфигурация локальных путей
|
||||
SOURCE_CSV = Path("../../dataset/DEAM/DEAM_Annotations/annotations/annotations averaged per song/song_level/static_annotations_averaged_songs_1_2000.csv")
|
||||
OUTPUT_CSV = Path("../../dataset/DEAM/music_db.csv")
|
||||
|
||||
def prepare_deam_database():
|
||||
if not SOURCE_CSV.exists():
|
||||
print(f"Исходный файл аннотаций не найден: {SOURCE_CSV}")
|
||||
return
|
||||
|
||||
print("Обработка разметки датасета DEAM...")
|
||||
|
||||
# Загрузка сырых данных с очисткой артефактов форматирования
|
||||
raw_df = pd.read_csv(SOURCE_CSV, skipinitialspace=True)
|
||||
|
||||
# Экстракция координат пространства Рассела (Valence/Arousal)
|
||||
processed_df = raw_df[['song_id', 'valence_mean', 'arousal_mean']].copy()
|
||||
processed_df.columns = ['song_id', 'valence', 'arousal']
|
||||
|
||||
# Приведение идентификаторов к формату файловой системы (int)
|
||||
processed_df['song_id'] = processed_df['song_id'].astype(int)
|
||||
|
||||
processed_df.to_csv(OUTPUT_CSV, index=False)
|
||||
|
||||
print(f"База успешно сформирована. Всего записей: {len(processed_df)}")
|
||||
|
||||
if __name__ == "__main__":
|
||||
prepare_deam_database()
|
||||
Reference in New Issue
Block a user