رسالة جامعية

Melody extraction from polyphonic music signals

التفاصيل البيبلوغرافية
العنوان: Melody extraction from polyphonic music signals
المؤلفون: Salamon, Justin J.
المساهمون: Gómez Gutiérrez, Emilia, Serra, Xavier, Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
المصدر: TDX (Tesis Doctorals en Xarxa)
بيانات النشر: Universitat Pompeu Fabra
سنة النشر: 2013
المجموعة: Tesis Doctorals de la Universitat d'Andorra (TDX)
مصطلحات موضوعية: Melody extraction, Predominant melody estimation, Fundamental frequency, Music information retrieval, Audio content processing, Pitch, Contour, Polyphonic, Music similarity, Version identification, Query by humming, Melody, Bass line, Harmony, Genre classification, Tonic identification, Indian classical music, Flamenco, Automatic music transcription, Melodic transcription, Evaluation methodology, Auditory scene analysis, Melodic contour, Music signal processing, Extracción de melodía, Estimación de la melodía predominante, Frecuencia fundamental, Recuperación de la información musical, Procesado de contenido de audio, Contorno tonal
الوصف: Music was the first mass-market industry to be completely restructured by digital technology, and today we can have access to thousands of tracks stored locally on our smartphone and millions of tracks through cloud-based music services. Given the vast quantity of music at our fingertips, we now require novel ways of describing, indexing, searching and interacting with musical content. In this thesis we focus on a technology that opens the door to a wide range of such applications: automatically estimating the pitch sequence of the melody directly from the audio signal of a polyphonic music recording, also referred to as melody extraction. Whilst identifying the pitch of the melody is something human listeners can do quite well, doing this automatically is highly challenging. We present a novel method for melody extraction based on the tracking and characterisation of the pitch contours that form the melodic line of a piece. We show how different contour characteristics can be exploited in combination with auditory streaming cues to identify the melody out of all the pitch content in a music recording using both heuristic and model-based approaches. The performance of our method is assessed in an international evaluation campaign where it is shown to obtain state-of-the-art results. In fact, it achieves the highest mean overall accuracy obtained by any algorithm that has participated in the campaign to date. We demonstrate the applicability of our method both for research and end-user applications by developing systems that exploit the extracted melody pitch sequence for similarity-based music retrieval (version identification and query-by-humming), genre classification, automatic transcription and computational music analysis. The thesis also provides a comprehensive comparative analysis and review of the current state-of-the-art in melody extraction and a first of its kind analysis of melody extraction evaluation methodology. ; La industria de la música fue una de las primeras en verse completamente ...
نوع الوثيقة: doctoral or postdoctoral thesis
وصف الملف: 253 p.; application/pdf
اللغة: English
العلاقة: http://hdl.handle.net/10803/123777Test; B. 24731-2013
الإتاحة: http://hdl.handle.net/10803/123777Test
حقوق: ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs. ; info:eu-repo/semantics/openAccess
رقم الانضمام: edsbas.5F7E3DD3
قاعدة البيانات: BASE