89 lines
3.0 KiB
Plaintext
89 lines
3.0 KiB
Plaintext
{
|
|
"cells": [
|
|
{
|
|
"cell_type": "code",
|
|
"execution_count": 5,
|
|
"id": "b92e0213",
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"source": [
|
|
"import pandas as pd\n",
|
|
"from pathlib import Path"
|
|
]
|
|
},
|
|
{
|
|
"cell_type": "code",
|
|
"execution_count": 7,
|
|
"id": "1763c51e",
|
|
"metadata": {},
|
|
"outputs": [
|
|
{
|
|
"name": "stdout",
|
|
"output_type": "stream",
|
|
"text": [
|
|
"✅ УСПЕХ! База создана: ../../dataset/DEAM/music_db.csv\n",
|
|
"Всего треков в базе: 1744\n",
|
|
"Пример данных:\n",
|
|
" song_id valence arousal\n",
|
|
"0 2 3.1 3.0\n",
|
|
"1 3 3.5 3.3\n",
|
|
"2 4 5.7 5.5\n",
|
|
"3 5 4.4 5.3\n",
|
|
"4 7 5.8 6.4\n"
|
|
]
|
|
}
|
|
],
|
|
"source": [
|
|
"# Точный путь к оригинальным аннотациям\n",
|
|
"source_path = Path(\"../../dataset/DEAM/DEAM_Annotations/annotations/annotations averaged per song/song_level/static_annotations_averaged_songs_1_2000.csv\")\n",
|
|
"# Путь, куда сохраним очищенную базу для движка\n",
|
|
"output_path = Path(\"../../dataset/DEAM/music_db.csv\")\n",
|
|
"\n",
|
|
"if not source_path.exists():\n",
|
|
" print(f\"❌ Исходный файл не найден по пути: {source_path}\")\n",
|
|
"else:\n",
|
|
" # skipinitialspace=True уберет лишние пробелы в названиях колонок, если они есть\n",
|
|
" df = pd.read_csv(source_path, skipinitialspace=True)\n",
|
|
" \n",
|
|
" # Берем только нужные колонки (по твоему примеру)\n",
|
|
" clean_df = df[['song_id', 'valence_mean', 'arousal_mean']].copy()\n",
|
|
" \n",
|
|
" # Переименовываем для простоты кода в движке\n",
|
|
" clean_df.columns = ['song_id', 'valence', 'arousal']\n",
|
|
" \n",
|
|
" # Приводим ID к целому числу (2, 3, 4...), чтобы искать файлы '2.mp3'\n",
|
|
" clean_df['song_id'] = clean_df['song_id'].astype(int)\n",
|
|
" \n",
|
|
" # Сохраняем финальный файл\n",
|
|
" clean_df.to_csv(output_path, index=False)\n",
|
|
" \n",
|
|
" print(f\"✅ УСПЕХ! База создана: {output_path}\")\n",
|
|
" print(f\"Всего треков в базе: {len(clean_df)}\")\n",
|
|
" print(\"Пример данных:\")\n",
|
|
" print(clean_df.head())"
|
|
]
|
|
}
|
|
],
|
|
"metadata": {
|
|
"kernelspec": {
|
|
"display_name": "Python (thesis)",
|
|
"language": "python",
|
|
"name": "thesis"
|
|
},
|
|
"language_info": {
|
|
"codemirror_mode": {
|
|
"name": "ipython",
|
|
"version": 3
|
|
},
|
|
"file_extension": ".py",
|
|
"mimetype": "text/x-python",
|
|
"name": "python",
|
|
"nbconvert_exporter": "python",
|
|
"pygments_lexer": "ipython3",
|
|
"version": "3.11.7"
|
|
}
|
|
},
|
|
"nbformat": 4,
|
|
"nbformat_minor": 5
|
|
}
|