{ "cells": [ { "cell_type": "code", "execution_count": 5, "id": "b92e0213", "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "from pathlib import Path" ] }, { "cell_type": "code", "execution_count": 7, "id": "1763c51e", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "✅ УСПЕХ! База создана: ../../dataset/DEAM/music_db.csv\n", "Всего треков в базе: 1744\n", "Пример данных:\n", " song_id valence arousal\n", "0 2 3.1 3.0\n", "1 3 3.5 3.3\n", "2 4 5.7 5.5\n", "3 5 4.4 5.3\n", "4 7 5.8 6.4\n" ] } ], "source": [ "# Точный путь к оригинальным аннотациям\n", "source_path = Path(\"../../dataset/DEAM/DEAM_Annotations/annotations/annotations averaged per song/song_level/static_annotations_averaged_songs_1_2000.csv\")\n", "# Путь, куда сохраним очищенную базу для движка\n", "output_path = Path(\"../../dataset/DEAM/music_db.csv\")\n", "\n", "if not source_path.exists():\n", " print(f\"❌ Исходный файл не найден по пути: {source_path}\")\n", "else:\n", " # skipinitialspace=True уберет лишние пробелы в названиях колонок, если они есть\n", " df = pd.read_csv(source_path, skipinitialspace=True)\n", " \n", " # Берем только нужные колонки (по твоему примеру)\n", " clean_df = df[['song_id', 'valence_mean', 'arousal_mean']].copy()\n", " \n", " # Переименовываем для простоты кода в движке\n", " clean_df.columns = ['song_id', 'valence', 'arousal']\n", " \n", " # Приводим ID к целому числу (2, 3, 4...), чтобы искать файлы '2.mp3'\n", " clean_df['song_id'] = clean_df['song_id'].astype(int)\n", " \n", " # Сохраняем финальный файл\n", " clean_df.to_csv(output_path, index=False)\n", " \n", " print(f\"✅ УСПЕХ! База создана: {output_path}\")\n", " print(f\"Всего треков в базе: {len(clean_df)}\")\n", " print(\"Пример данных:\")\n", " print(clean_df.head())" ] } ], "metadata": { "kernelspec": { "display_name": "Python (thesis)", "language": "python", "name": "thesis" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.7" } }, "nbformat": 4, "nbformat_minor": 5 }