ref: refactor before chekout

This commit is contained in:
zin
2026-06-02 17:27:05 +00:00
parent 9ce92b70a9
commit f04cd7359b
27 changed files with 1103 additions and 4266 deletions
+30
View File
@@ -0,0 +1,30 @@
import pandas as pd
from pathlib import Path
# Конфигурация локальных путей
SOURCE_CSV = Path("../../dataset/DEAM/DEAM_Annotations/annotations/annotations averaged per song/song_level/static_annotations_averaged_songs_1_2000.csv")
OUTPUT_CSV = Path("../../dataset/DEAM/music_db.csv")
def prepare_deam_database():
if not SOURCE_CSV.exists():
print(f"Исходный файл аннотаций не найден: {SOURCE_CSV}")
return
print("Обработка разметки датасета DEAM...")
# Загрузка сырых данных с очисткой артефактов форматирования
raw_df = pd.read_csv(SOURCE_CSV, skipinitialspace=True)
# Экстракция координат пространства Рассела (Valence/Arousal)
processed_df = raw_df[['song_id', 'valence_mean', 'arousal_mean']].copy()
processed_df.columns = ['song_id', 'valence', 'arousal']
# Приведение идентификаторов к формату файловой системы (int)
processed_df['song_id'] = processed_df['song_id'].astype(int)
processed_df.to_csv(OUTPUT_CSV, index=False)
print(f"База успешно сформирована. Всего записей: {len(processed_df)}")
if __name__ == "__main__":
prepare_deam_database()