faculdade de medicina faculdade de...
TRANSCRIPT
UNIVERSIDADE DE LISBOA
FACULDADE DE CIÊNCIAS
FACULDADE DE LETRAS
FACULDADE DE MEDICINA
FACULDADE DE PSICOLOGIA
Por que gostamos de música?
Um entendimento interdisciplinar
para a Hipótese das Expectativas
LUANA BRASIL DIAS
Dissertação orientada por:
Prof. Dr. Luís Correia (FCUL)
Prof. Dr. Paulo Ventura (FPUL)
Co-orientada por: Prof. Dr. António Manuel Correia de Jesus Lopes (FLUL)
MESTRADO EM CIÊNCIA COGNITIVA
2017
2
Dedicada a todos os músicos e compositores
que inspiraram esta dissertação,
especialmente a
Arvo Pärt,
Steve Gunn,
Mogwai
e John Frusciante.
3
Agradecimentos
Ao Eduardo (como Sancho Pança acompanha Dom Quixote em todos os seus
delírios) por ter acreditado no sonho deste mestrado, agora transformado em
realidade.
Aos meus pais Irineu Dias e Neusa Brasil por todo o apoio, pelo amor incondicional
e principalmente por acreditarem na educação como ferramenta de emancipação
humana.
A Nair Brasil (in memoriam, minha avó querida que sempre ofereceu-me suporte
para os estudos.
A Adriano Lopes de Oliveira e Maria Teresa Fernandes por todo o apoio e cuidado
que tiveram em muitos sentidos.
A Luis Correia pela abertura a um tema tão controverso pela orientação e pela
receptividade.
A Paulo Ventura pela orientação e generosidade.
A António Lopes, meu co-orientador, pelas astutas perspectivas filosóficas que
ofereceu a este trabalho.
Aos meus colegas portugueses que no decorrer deste curso de mestrado se
transformaram em bons e grandes amigos, por tudo: David Souza, Tiago Brito,
Marco Carvalho, Mário Carvalho: my niggas.
A Adriano Augusto: um exímio músico e professor de piano, e excelente
interlocutor quando o assunto é MÚSICA! Obrigada pelas colaborações para esta
tese.
Aos meus amigos que durante a vida me apresentaram o que havia de melhor na
música.
E, finalmente, a todos os músicos e musicistas que me salvaram dos meus abismos,
ativando meu sistema de recompensa, produzindo respostas hedônicas no meu corpo
quando eu mais precisei durante o curso da minha existência. E não foram poucas
vezes.
4
La musique est peut-être l‟exemple unique
de ce qu‟aurait pu être - s‟il n‟y avait pas eu
l‟invention du langage, la formation des mots,
l‟analyse des idées - la communication des âmes.
(Marcel Proust)
5
RESUMO
LUANA, B.D. POR QUE GOSTAMOS DE MÚSICA? Um entendimento
interdisciplinar para a hipótese das expectativas. 2017. Dissertação de Mestrado.
Universidade de Lisboa. Ciência Cognitiva. Lisboa, 2017.
Esta dissertação busca compreender a razão pela qual os humanos apreciam música.
Para tanto, foi desenvolvida uma breve revisão de literatura sobre os estudos experimentais que
abordaram os correlatos neurais da fruição musical. Experimentos com neuroimagem
demonstram que a escuta musical modula fortemente a atividade de estruturas envolvidas no
processamento de recompensas, incluindo o núcleo accumbens e a área tegmental ventral, bem
como o hipotálamo e a ínsula, que se pensa estarem envolvidas na regulação de respostas
autonômicas e fisiológicas a estímulos gratificantes. Curiosamente, não há liberação de
dopamina apenas nos momentos de prazer máximo durante a escuta musical, mas também em
antecipação aos momentos de chill, conforme estudos experimentais que combinaram as
técnicas de Emissão de Pósitrons e Ressonância Magnética. Esses achados permitem uma
revisita à Hipótese das Expectativas, lançada em 1956 pelo o musicólogo Leonard Meyer, um
defensor da ideia de que o prazer sentido com a música pode ser compreendido de acordo com
as expectativas musicais cumpridas ou suspensas. Em Meyer, o desdobramento temporal dos
sons conduz à criação de expectativas e as resoluções em violação, confirmação ou atraso
podem gerar excitação e ativar os mecanismos de gratificação. A formação de expectativas é
considerada uma adaptação biológica, dotada de estruturas fisiológicas especializadas, um
dispositivo da evolução altamente adaptativo.
Ao analisar as características subjacentes ao Sistema Tonal, foi verificado que as
regularidades estatísticas da música ocidental fornecem um rico material para a formação de
previsões pelo sistema nervoso. Elas são elicitadas por meio da memória implícita e da
capacidade do cérebro de extrair as regularidades do meio ambiente ao longo do tempo. Estudos
comportamentais evidenciam que deteção de padrões e a formação de expectativas são
possibilitadas pela exposição incidental a estímulos musicais. Através da exposição sistemática
às propriedades estatísticas melódicas e harmônicas do registro tonal, os ouvintes formam um
modelo mental implícito de tonalidade, adquirido sem acionamento consciente de recursos
atencionais. Experimentos com redes neurais artificiais não-supervisionadas demonstraram que
o conhecimento implícito da estrutura tonal pode ser internalizado através da auto-organização
neural resultante da mera exposição a combinações simultâneas de sequências de tons.
Estes dados habilitam a interpretação do processamento musical de acordo com
modelos probabilísticos de inferência, consoante abordagens bayesianas para o funcionamento
cerebral, sendo o paradigma da Codificação Preditiva a mais recente e robusta delas. Entende-se
que as inferências probabilísticas em relação à música só podem ser feitas porque há duas
gramáticas musicais em interação constante, em estratégias de processamento de informação
bottom-up e top-down: uma gramática interna – individual e subjetiva - construída por
aprendizagem implícita; e outra gramática cultural.
Compreende-se, destarte, a musicalidade como um fenômeno cultural inextricável ao
cérebro humano. Um produto natural e social: natural porque explora estruturas evolutivas
importantes, como a capacidade preditiva, para qual cada indivíduo possui um aparato biológico
que o capacita; social por se manifestar de acordo com as regras culturais pré-existentes, tais
quais o idioma tonal.
Palavras-Chave: fruição musical, hipótese das expectativas, cognição musical.
6
ABSTRACT
LUANA, B.D. WHY DO WE ENJOY MUSIC? An interdisciplinary
understanding for Expectation Hypothesis. 2017. Dissertação de Mestrado.
Universidade de Lisboa. Ciência Cognitiva. Lisboa, 2017.
This thesis seeks to understand the reason why humans appreciate music. For this
purpose, we have developed a brief review of the literature on the experimental studies that
addressed the neural correlates of musical fruition. Neuroimaging experiments demonstrate that
musical listening strongly modulates the activity of structures involved in reward processing,
including the nucleus accumbens and the ventral tegmental area, as well as the hypothalamus
and insula, which are thought to be involved in the regulation of autonomic and physiological
responses to rewarding stimuli. Interestingly, the release of dopamine happens not only in
moments of maximum enjoyment during musical listening, but also in anticipation of chill
moments, according to experimental studies that combined the techniques of Positron Emission
and Magnetic Resonance. These findings allow us to revisit the Expectations Hypothesis,
launched in 1956 by musicologist Leonard Meyer, a supporter of the idea that the pleasure we
feel with music can be understood based on musical expectations fulfilled or suspended.
For Meyer, the temporal unfolding of sounds leads to the creation of expectations, and its
resolutions in violation, confirmation or delay can generate excitement and activate reward
mechanisms. The expectancy is considered a biological adaptation with specialized
physiological structures, a device of highly adaptive evolution.
In analyzing the underlying characteristics of the tonal system, we find that the
statistical regularities of ocidental music provide material for prediction and formation of
expectation by the nervous system through implied memory and the brain's ability to extract
regularities from the environment over time. Behavioral studies evidence that pattern detection
and formation of expectations are made possible by incidental exposure to musical
stimuli. Through the systematic exposure to the melodic and harmonic statistical properties of
the tonal system, the listeners form an implicit mental model of tone, acquired without
conscious activation of attentional resources. Experiments with unsupervised artificial neural
networks (ANNs) have demonstrated that the implicit knowledge of the tonal structure can be
internalized through neural self-organization resulting from mere exposure to simultaneous
combinations of tone sequencing. Thus, musical processing can be interpreted according to
probabilistic models of inference, in consonance with the Bayesian approaches to brain
functioning, the most recent of which is the Predictive Coding paradigm. It is understood that
the probabilistic inferences regarding music can only be made because there are two musical
grammars in constant interaction, in bottom-up and top-down information processing strategies:
an internal grammar - individual and subjective - constructed by implicit learning ; and the
other, a cultural acquired grammar.
Musicality can be understood, therefore, as a cultural phenomenon inextricable to the
human brain. A natural and social product: natural because it explores important evolutionary
structures, such as predictive capacity, for which each individual has a biological structure that
enables it; social because it manifests itself in accordance with pre-existing cultural rules, such
as the tonal language.
KEY-WORDS: music fruition, expectation hypothesis, music cognition.
8
Sumário
Lista de Figuras ...................................................................................................... 11
Introdução Geral ................................................................................................... 12
I - Primeiro Movimento - O que acontece no nosso cérebro quando sentimos
prazer com a música? ........................................................................................................... 16
1. Introdução .................................................................................................... 17
2. Música e Recompensa ................................................................................. 18
a) O Sistema de Recompensa e Reforço no Cérebro Humano ........................... 19
b) Anatomia das Vias Dopaminérgicas ................................................................. 19
c) A Música ativa as Vias Mesolímbicas .............................................................. 20
3. O Ciclo do Prazer ................................................................................................ 21
4. Ativação de Áreas Subcorticais ....................................................................... 22
a) Estudos com PET ............................................................................................ 22
b) Estudos com fMRI .......................................................................................... 24
c) A Dopamina no Prazer Musical ................................................................... 25
5. O Envolvimento de Áreas Corticais ................................................................ 26
a) Córtex Orbitofrontal ....................................................................................... 26
b) Córtex Temporal Superior ............................................................................. 26
c) Córtex Frontal Superior.................................................................................. 27
6. Integração de Regiões Cerebrais na Apreciação Musical ......................... 27
7. Conclusão .............................................................................................................. 28
II- Interlúdio ........................................................................................................................... 30
1. Breves Noções sobre o Sistema Tonal ..................................................................
a) O Sistema Tonal ................................................................................................... 31
b) A Série Harmônica .............................................................................................. 32
c) A Escala Cromática ............................................................................................. 33
d) Os Acordes ........................................................................................................... 34
e) O Tom .................................................................................................................. 35
f) O Ciclo de Quintas .............................................................................................. 36
9
2. Experimento Probe-Tone .................................................................................. 37
III- Segundo Movimento - Qual a razão pela qual sentimos prazer com a música?
1. Introdução .......................................................................................................... 41
2. Neuropsicologia das Expectativas Musicais .................................................... 41
2.1. Música e Efeito Priming ........................................................................................ 41
a) A Memória como Fonte de Expectativas Musicais............................................ 43
b) A Memória e o Conhecimento Explícito da Música .......................................... 43
c) A Memória e o Aprendizado Implícito e Estatístico da Música ...................... 44
d) Experiências de Aprendizagem com Gramáticas Artificiais ............................ 46
2.2. Entropia na Música ................................................................................................ 50
a) Entropia e Agradabilidade ..................................................................................... 51
b) Agradabilidade e Exposição .................................................................................. 52
2.3. Abordagens Bayesianas e Codificação Preditiva ............................................. 53
a) Erros de Predição .................................................................................................... 56
b) Tipos de Erros de Predição Musical .................................................................... 59
2.4. Psicologia das Expectativas .................................................................................... 60
2.5. Biologia do Pessimismo ............................................................................................ 62
3. Intersecção entre Música e Linguagem .................................................................. 65
3.1. Hipótese do Compartilhamento dos Recursos Sintáticos Integrados ...... 66
a) Detecção de Incongruências .................................................................................. 66
3.2. Teoria Gerativa da Música Tonal .................................................................... 68
3.3. Modelos de Expectativa para a Melodia ........................................................ 70
a) Modelo de Narmour .............................................................................................. 71
b) Modelo de Margulis .............................................................................................. 71
c) Modelo Generalista de Huron ............................................................................. 72
3.4. Regularidades Tonais .......................................................................................... 72
4. Música e Conexionismo ............................................................................................. 73
10
4.1 Modelagens da Cognição Musical em Redes Neurais ................................... 74
a) Redes SOM e a Detecção do Centro Tonal ....................................................... 74
b) MUSACT ............................................................................................................... 75
5. Discussão – Enquadramento Filosófico ................................................................ 80
IV - Considerações Finais ..................................................................................................... 82
V - Referências ........................................................................................................................ 85
VI - Apêndice ........................................................................................................................... 94
11
LISTA DE FIGURAS
Figura 1 - Esquema que mostra a difusão das fibras dopaminérgicas.
Figura 2 – Fases do Ciclo do Prazer e suas resoluções no tempo.
Figura 3 – Ilustração das estruturas límbicas e paralímbicas envolvidas na escuta
musical.
Figura 4 – Desenho esquemático dos processos e regiões cerebrais que habilitam a
predição durante a escuta musical.
Figura 5 – Representação da série harmônica por Wisnik (2014)
Figura 6 – Escala cromática ascendente e descendente.
Figura 7 – Ciclo de Quintas representando as distâncias entre tons maiores.
Figura 8 – Resultados encontrados pro Krumhansl.
Figura 9 – Sequenciamento de tons mais aguardados.
Figura 10 – Gramática de estados-finitos utilizada em estudos de aprendizagem
implícita sobre a linguagem.
Figura 11 – Gramática de estados-finitos utilizada em estudos de aprendizagem
implícita musical.
Figura 12 – Exemplos de excertos – extraído de Tillmann (2010).
Figura 13 –. Proposta de entendimento da relação entre exposição e agradabilidade
musical de Vuust (2017).
Figura 14 – Ativação de neurônios dopaminérgicos e sua relação com os erros de
predição (Schultz, 1997).
Figura 15 – Esquema de expectativas proposto por David Huron (2006).
Figura 16 – Esquema para as vias lentas e rápidas de resposta ao medo (traduzido de
Huron, 2006).
Figura 17 – Diagrama da correlação música versus linguagem, segundo a hipótese de
Integração de Recursos Sintáticos Compartilhados (Patel, 2008).
Figura 18 – Diferentes finalizações para fragmentos musicais usados por Besson &
Faïta (1995).
Figura 19 – Ativações bottom-up e top-down reverberadas na rede MUSACT pela
ativação do acorde Dó Maior (Bharucha, 1987).
12
Introdução Geral Os pesquisadores Josh McDermott, do MIT, e Marc Hauser, de Harvard,
consideram que, sob a perspectiva da Ciência Cognitiva, a musicalidade humana é um
dos fenômenos mais bizarros e fascinantes do comportamento da espécie. Encontrada
em todas as culturas do passado e do presente, a música é considerada um traço
universal (Mcdermott & Hauser, 2005). Ela toma para si um estatuto de bastante
destaque em relação a outros comportamentos considerados prazerosos (tais como
comer ou fazer sexo), pois diferentemente desses estímulos, a gratificação musical não
possui uma razão clara para a Ciência. Já em 1871, Darwin interessava-se pelo
entendimento da música através da perspectiva evolucionista.
O comportamento musical pode ser considerado uma adaptação biológica
(Darwin, 1963; Miller, 2000; Huron, 2006) ou apenas uma colateralidade das
propriedades do sistema auditivo que evoluiu para outros propósitos, conforme postula
Steven Pinker em How The Mind Works (1997). Pinker chama a musicalidade de
"cheesecake auditivo": uma sobremesa deliciosa, mas, pelo viés evolutivo, é nada mais
do que um subproduto da linguagem. "Eu suspeito que a música seja um cheesecake
auditivo, uma confecção requintada, criada para agradar os pontos sensíveis de nossas
faculdades mentais", diz. A música afeta nossos cérebros em locais específicos,
estimulando a produção de substâncias únicas que têm um efeito prazeroso em nosso
humor. No entanto, é largamente discutido se a musicalidade humana é uma
característica que sobreviveu à seleção natural, a fim de estimular e desenvolver outras
faculdades mentais (Honning, 2013) - ao invés de um mero subproduto da evolução
(Pinker, 1997).
As possíveis ações adaptativas da música oferecem à Ciência Cognitiva, e a
este trabalho, razão para dedicação ao tema. Tendo em vista este debate, elaborou-se um
trabalho de cunho teórico que se dividiu em duas partes:
Na primeira, buscou-se dar conta da premissa que fundamenta a pergunta
originária desta dissertação: „por que gostamos de música?’, seja a afirmação: a música
gera prazer, entendendo o prazer como um mecanismo biológico de motivação e
reforço comportamental. Desenvolveu-se uma pesquisa de Revisão Sistemática de
Literatura para estudos neurobiológicos e experimentais que relacionaram os conceitos
de prazer, música e cérebro, no intuito de compreender o que acontece no encéfalo
humano quando este é recompensado durante a escuta de estímulos musicais. Os
13
resultados evidenciaram que a música considerada prazerosa ativa uma intensa
participação do sistema dopaminérgico de recompensa, nas vias mesolímbicas,
estruturas evolutivamente muito antigas, atualmente reconhecidas por codificarem as
expectativas e as violações de expectativas, também conhecidas como Erros de Predição
em Resposta à Recompensa (Vuust, 2014).
A segunda parte da dissertação busca interpretar o resultado da Revisão
Sistemática de Literatura, no intuito de oferecer uma resposta à pergunta original: “qual
a razão pela qual nosso cérebro é gratificado pela escuta musical?”, tendo em vista
que não há clareza sobre os benefícios adaptativos desse comportamento. Esta pergunta
suscita elaborações que apenas a interdisciplinaridade do campo da Cognição Musical
pode dar conta, uma vez que o objeto musical possui uma dupla abordagem: uma que
recai sobre o Sistema Tonal ocidental e suas funções contextuais e a outra que diz
respeito às representações mentais de um evento musical, por exemplo: a imagem
mental de um um acorde, de um tom ou de uma nota.
Neste segundo momento, a metodologia aplicada difere da primeira: apesar de
ter sido utilizada uma revisão de literatura, o critério utilizado na seleção do corpus
bibliográfico foi a autoridade epistêmica dos autores que trataram do tema. Entre os
muitos mecanismos postulados para explicar o prazer gerado pela música, uma ideia
envolve a recompensa associada à expectativa e à frustração de predição (Huron, 2006).
Interpretou-se os resultados obtidos nos estudos neurobiológicos na primeira parte à luz
de teorias para a expectativa musical, hipótese sugerida primeiramente por Meyer em
1956. Tal hipótese é frequentemente revista por uma série de pesquisadores
cognitivistas que lançam mão do cabedal de conhecimento científico hodierno para
predições e expectativas a fim de explicar a fruição musical conforme os termos de
Meyer.
O prazer musical é conduzido por uma dinâmica de ação combinada entre as
expectativas e as predições feitas pelo ouvinte consoante as regularidades estatísticas da
estrutura musical, em especial às do idioma tonal que se estabeleceu naturalmente entre
as culturas ocidentais (Meyer, 1956). A isto, o musicólogo Leonard Meyer denominou
Hipótese das Expectativas.
A formação de expectativas é considerada um importante e vantajoso
mecanismo evolutivo, uma adaptação biológica com estruturas fisiológicas
especializadas (Huron, 2006). O envolvimento dos mecanismos de recompensa durante
14
a escuta musical foi entendido conforme O Ciclo do Prazer (Berridge, 2006), que
estabelece três fases distintas para o prazer: o querer (comportamento motivado), o
gostar (resposta hedônica) e o aprender.
Em seguida, foram apresentados estudos comportamentais que evidenciam a
apreensão e formação de expectativas conduzidas pela exposição a estímulos musicais,
sendo elas originadas pela memória de aprendizado implícito e sem acionamento
consciente de recursos atencionais. Através da exposição às propriedades estatísticas
(melódicas e harmônicas), os ouvintes formam um modelo mental implícito de
tonalidade que possibilita as inferências. Evidências para isso foram fornecidas pelo
trabalho seminal de Krumhansl e colegas (Krumhansl, 1979, 2010), empregando o
Paradigma Probe-Tone, em que os ouvintes avaliam o quão bem uma nota se encaixa
em uma sequência musical, tendo como referência o contexto anterior.
Entendemos que as inferências probabilísticas em relação à musica só podem
ser feitas porque o sistema nervoso mantém modelos probabilísticos internos que são
constantemente atualizados pelo processamento de informação sensorial, utilizando
métodos que se aproximam da probabilidade bayesiana. Estudos teóricos questionam
como o cérebro pode implementar algoritmos bayesianos. Friston (2010), Huettel
(2005), Knill e colegas (2004) estão entre os que assumem que a Codificação Preditiva
é um modelo neurobiologicamente plausível para o modo com que o cérebro infere as
causas da entrada sensorial com base na minimização do erro de predição, a fim de
aumentar sua energia livre. Esse paradigma demonstra como os neurônios podem
reconhecer padrões por inferência bayesiana (Friston, 2010).
Tais inferências probabilísticas em relação à música só podem ser feitas
porque há duas gramáticas musicais em interação constante no processamento musical:
uma interna – individual - construída por aprendizado implícito e outra gramática
cultural, correspondente ao idioma tonal. A gramática da música ocidental tonal é
dotada de uma estrutura geométrica formal que determina as relações e distâncias dentro
de um espaço harmônico, o que favorece a sua antecipação e a formação de predições.
Tillmann e Bharucha (2001) demonstraram que o conhecimento implícito da estrutura
tonal pode ser adquirido através da auto-organização neural resultante da mera
exposição a combinações simultâneas de seqüenciais de tons (Ibidem). Experimentos
com redes neurais artificiais não-supervisionadas evidenciaram que a estrutura
correlacional da música tonal pode ser internalizada durante o processo de
aprendizagem perceptual (Ibidem).
15
Assumimos que a apreciação musical pode ser compreendida pela interação de
fatores ascendentes e descendentes, sendo ascendentes as características internas do
estímulo e descendentes a influência de conhecimentos previamente adquiridos pela a
exposição.
Adiante, demonstramos que o prazer sentido durante a escuta musical é oriundo
da violação positiva de predições dos eventos sonoros (Vuust, 2004). Vuust estabelece
que ações gratificantes são aquelas que minimizam a energia livre do cérebro, criando
assim um modelo mais forte e preciso do mundo. Contudo, se sons escolhidos na
composição forem “melhores” do que o esperado pelo ouvinte - porque a composição
tonal possui regras preferenciais que habilitam a sua violação -, e se a escolha da
violação seguir critérios de otimização, haverá um erro positivo de predição, codificado
pelo sistema dopaminérgico, numa equação entre recompensa predita e recompensa
efetivada. Definir como é avaliado se a música é estruturalmente melhor do que a
sequência esperada requer, entretanto, uma melhor definição
A forma com que a música é valorizada está intimamente relacionada à
habilidade de aprender a hierarquia que subjaz o sistema tonal e à habilidade que temos
para predizê-lo (Huron, 2006). As regularidades musicais tonais foram compreendidas a
partir da Teoria Gerativa para a Música Tonal de Lerdahl e Jackendoff, que oferecem
um aporte teórico para a gramática musical, derivada da Psicologia Gestalt e da
Linguística Chomskyana (Lerdahl & Jackendoff, 1996). Buscou-se mostrar alguns dos
diferentes modelos de formação de expectativas melódicas, especialmente o paradigma
criado por David Huron, que em 2006 conduziu um estudo em profundidade para as
expectativas musicais e as regularidades da gramática tonal (Huron, 2006).
A hipótese deste esforço dissertativo é de que o prazer musical surge da aliança
de uma gramática composicional com a gramática do ouvinte, utilizando de forma
completa seus recursos cognitivos. As ligeiras violações dos templates mentais suscitam
os erros de predição. Se a atualização das previsões (mismatch) for melhor do que o
previsto, há um erro de predição positivo que desencadeia reações neurofisiológicas
semelhantes às do medo, mas que dentro de um contexto de apreciação estética se
converte em frisson, riso e reverência (Huron, 2006).
17
“Os estudos do cérebro e da música
podem ser mutuamente reveladores.”
(Robert Zatorre)
1. Introdução
O presente capítulo tem por objetivo apresentar a Revisão Sistemática de
Literatura sobre a ativação dos mecanismos de recompensa no cérebro humano durante
a escuta musical. Considerável progresso vem sendo feito em busca do entendimento
dos sistemas cognitivos, afetivos e neurais que subjazem o processamento musical e o
prazer obtido durante a fruição musical. Nos últimos vinte anos, neurocientistas
descobriram na música uma importante ferramenta para investigar os processos de
recompensa e as emoções no cérebro humano.
Esta etapa é necessária, pois fundamenta empiricamente a discussão que se
segue na segunda parte da tese, demonstrando que a música considerada prazerosa ativa
áreas cerebrais relacionadas à recompensa, à motivação, à resposta hedônica e à
aprendizagem.
Revisamos alguns estudos imageológicos e comportamentais relacionados ao
prazer gerado pela música. No que diz respeito ao escopo, o vetor principal estabelecido
foram as estruturas cerebrais relacionadas ao prazer na escuta musical. Esta revisão
sistemática seguiu a Recomendação PRISMA1, quando aplicável. Os mecanismos de
busca utilizados foram PubMed, PubPsych e PsychInfo para estudos publicados em
Inglês.
Os termos de busca na pesquisa foram: (reward OR pleasure) AND (listen*to
music) AND (brain OR neuro). 44 artigos foram encontrados, 25 selecionados em três
rondas com uma semana de intervalo entre elas, durante os dias 17/12/2016 e
06/01/2017.
Os critérios de inclusão estabelecidos foram: ser pesquisa experimental; feita
com humanos; focando na perspectiva do ouvinte. Os critérios de exclusão foram:
artigos de revisão; estudos feitos com animais; estudos que não focavam na perspectiva
1 A recomendação PRISMA consiste em um checklist com 27 ítens e um fluxograma de quatro etapas. O
objetivo do PRISMA é ajudar os autores a melhorarem o relato de revisões sistemáticas e meta-análises.
Para mais, consultar: http://www.prisma-statement.org/
18
do ouvinte; ou não tratavam especificamente do tema abordado. Priorizamos a seleção
de experimentos feitos com pessoas saudáveis, ainda que algum estudo com ouvintes
não regulares tenha sido incluído para questões de comparação.
2. Música e Recompensa
Achados arqueológicos encontrados à beira do rio Danúbio, na Alemanha,
revelam que a musicalidade faz parte do trato cognitivo humano desde a pré-história, no
Paleolítico Superior (Gold et al, 2013). A musicalidade, assim como a linguagem, é um
traço universal que faz parte de todas as sociedades humanas ao longo da história. Em
todas as culturas, desde que se tem registro, as pessoas apreciam e produzem música
(Wang, 2015).
Pesquisadores acreditam que a ubiquidade musical pode ser explicada por sua
propriedade de permitir a expressão e a regulação de emoções, influenciando o humor e
evocando uma forte sensação de recompensa, embora a música permaneça como uma
importante fonte de prazer, sem nenhum valor evidente para a sobrevivência
(Salimpoor, 2011; Zatorre, 2011; Vuust, 2014; Koelsh, 2015).
Do ponto de vista do ouvinte, o processamento musical envolve o rastreamento
de séries de eventos sonoros no decorrer do tempo (Salimpoor, 2009). O fenômeno
musical não se apresenta como unidade, mas como um multi-grupo de representações
mentais. Sua fruição envolve a ação orquestrada de um conjunto de mecanismos
nervosos que representam diferentes tipos de memória, componentes atencionais e
perceptivas, respostas afetivas, dentre outros recursos cognitivos, muitos deles ainda
não bem compreendidos no campo da cognição (Ibidem).
No que tange a recompensa: o disparo bifásico do neurotransmissor dopamina
nas vias mesolímbicas do mesencéfalo pôde ser detectado em ouvintes durante a escuta
musical, num experimento feito por Valorie Salimpoor em 2011 (Salimpoor et al,
2011). Esse feixe de fibras nervosas têm o preciso papel de codificar o valor da
recompensa (Weigmann, 2017), especialmente no núcleo accumbens (Mavridis, 2015).
O fenômeno é associado à ativação da área tegmental ventral e do núcleo accumbens,
localizados no estriado dorsal e estriado ventral, respectivamente.
19
a-) O Sistema de Recompensa e Reforço no Cérebro Humano
Ainda que existam muitos tipos de recompensa, as mais fundamentais parecem
ser aquelas relacionadas à comida e ao sexo. Ambas são absolutamente relevantes para a
preservação da vida e a propagação da espécie. É demonstrado que estes
comportamentos adaptativos são reforçados qualitativamente através da via
dopaminérgica mesoestriatal (Cannon & Bseikri, 2004), circuito compartilhado com
outras espécies.
Na década de 1950, James Olds e Peter Milner (Olds and Milner, 1954), da
Universidade de Montreal, num erro de laboratório, colocaram eletrodos nas fibras
dopaminérgicas de vias próximas ao estriado ventral de ratos, quando tinham como alvo
o sistema reticular ascendente. Eles perceberam que os ratos continuavam voltando ao
lugar em que foram estimulados. Ao notar o comportamento, os pesquisadores
desenvolveram um aparato que possibilitava aos ratos pressionarem uma alavanca para
estimular seus próprios cérebros e observaram que os animais mantiveram esse
comportamento persistentemente até morrerem de inanição. Outros estudos (Fibiger &
Phillips, 1979; Olds, 1956; Routtenberg & Lindy, 1965) observaram que os ratos
mantinham o mesmo padrão de comportamento se fossem estimulados eletricamente
nas regiões do mesencéfalo em direção ao hipotálamo lateral e do estriado ventral ou se
fossem submetidos à administração de substâncias que estimulam a dopamina nestas
regiões. Foi notado ainda que a administração de drogas que bloqueiam a dopamina
cessava esse padrão comportamental.
b-) Anatomia das Vias Dopaminérgicas
As vias dopaminérgicas são formadas por dois clusters densos de corpos de
células neuronais no mesencéfalo: a substância negra e a área tegmental ventral
(Kandel, 2014). Cada lote de fibras que sai do cluster de células dopaminérgicas é
nomeado de acordo com os lugares de origem e o destino:
i-) Trato Nigroestriatal: Origina-se na zona compacta da substância negra e
sobe para regiões dorsais do estriado (núcleo caudado e putâmen dorsal). Esta
via é de grande importância às funções motoras voluntárias e é o primeiro alvo
na Doença de Parkinson.
20
ii-) Via Mesolímbica: Origina-se na área tegmental ventral e estende-se até a
região ventral do estriado, denominada núcleo accumbens. Estas células também
inervam partes do sistema límbico, incluindo a amígdala, o hipocampo, o septo e
o tubérculo olfativo. São as fibras reconhecidas por terem sido estimuladas por
Olds e Milner (1956).
iii-) Via Mesocortical: Origina-se na área tegmental ventral e desloca-se até o
córtex pré-frontal, o cingulado e os córtices perineais.
Figura 1 - Esquema que mostra a difusão das fibras dopaminérgicas
c-) A Música Ativa as Vias Mesolímbicas
Foi verificado que estudos de neuroimagem são principal método utilizado em
investigações para acessar os correlatos neuronais dos efeitos aprazíveis da música.
Experimentos utilizando Imagem por Ressonância Magnética Funcional (fMRI) e
Tomografia por Emissão de Pósitrons (PET) detectaram o acionamento das redes
mesocorticais e mesolímbicas de recompensa durante a escuta de estímulo musical
considerado agradável ou preferido pelos ouvintes. Encontrou-se também experimentos
que medem a atividade eletrodermal (Salimpoor et al, 2009; Bosch et al, 2013; Mueller
et al, 2015) e experimentos com tarefas comportamentais.
Os estudos demonstraram que a música pode modular a atividade cerebral em
uma série de regiões corticais e subcorticais. As regiões subcorticais que mostram
21
padrões de atividade em resposta à música incluem regiões do sistema límbico,
incluindo a amígdala, o hipocampo e o hipotálamo, bem como regiões para-límbicas,
tais como a ínsula e o córtex cingulado anterior. Estas estruturas são tipicamente
associadas à indução ou à experiência da excitação emocional (tradução nossa), ou mais
especificamente no emotional arousal, conforme a literatura.
O núcleo accumbens e a área ventral tegmental (relacionados à recompensa)
também tiveram suas ativações altamente detectadas nos estudos (Blood et al, 2001;
Brown et al, 2004; Menon et al, 2005; Mitterschiffhaler et al, 2007; Salimpooor et al,
2009; Osuch et al, 2009; Trost et al, 2011; Pereira et al, 2011; Salimpoor et al, 2011).
Ainda que os circuitos que medeiam a sensação de recompensa estejam
amplamente distribuídos, o núcleo accumbens é a porção mais importante para o centro
de prazer cerebral, denominado Centro de Recompensa2. Ele pertence aos gânglios da
base no cérebro humano (localizado no estriado ventral) e é conectado ao lobo límbico,
que regula as emoções e os comportamentos sociais e conecta-se também às células
extra-piramidais do sistema motor (Kandel, 2014).
O papel da dopamina encontra-se sob forte debate (Berridge et al., 2009), mas é
reconhecidamente o principal neurotransmissor do Centro de Recompensa (Kandel,
2014). Algumas teorias sugerem que a liberação dopaminérgica é relacionada aos
aspectos hedônicos da recompensa, entretanto, atualmente é mais aceito que este
neurotransmissor relaciona-se com a codificação da recompensa e com motivação para
ela, sendo os opióides endógenos os responsáveis pela resposta hedônica de fato
(Ibidem).
3. O Ciclo do Prazer
Segundo a hipótese do Ciclo do Prazer, este é um processo complexo de busca
por recompensas e avaliação, que pode ser pensado conforme o Modelo de Berridge
(Berridge, 2006), com três etapas vinculadas: o querer, o gostar e o aprender.
Querer – é a motivação para recompensa, modulada pela dopamina que controla
o desejo. É sabido que manipulações de dopamina alteram a quantidade de
comportamento ou esforço motivado (Berridge, 2006).
2 Reward System, na literatura em Inglês.
22
Gostar - É considerada a componente real do prazer. Trata-se do impacto
hedônico da recompensa orquestrado por opióides endógenos (Ibidem).
Aprender – São as associações, representações e previsões sobre recompensas
futuras com base em experiências passadas, reforçadas e codificadas pela dopamina
(Ibidem).
Figura 2 – Fases do Ciclo do Prazer e resoluções no tempo (Berridge, 2009).
Essas três componentes do Ciclo do Prazer trabalham separadamente, mas são
altamente conectadas. A antecipação do prazer, isto é, a expectativa ajuda a iniciar,
sustentar e encerrar as fases do querer, do gostar e do aprender (Berridge, 2006). A
integração da gratificação, do comportamento motivado e do aprendizado é feita pelo
córtex orbitofrontal (Kringelbach, 2005), que funciona como um módulo de controle.
4. A ativação de Áreas Subcorticais
a-) Estudos com Tomografia por Emissão de Pósitrons
O estudo pioneiro em neuroimagem para o prazer na escuta musical foi
conduzido por Blood e Zatorre (2001). Foi utilizada Tomografia por Emissão de
Pósitron (PET), uma técnica de imagem que permite avaliar perfusão sanguínea e a
atividade de diferentes regiões cerebrais. O PET demonstra a função metabólica do
cérebro, enquanto a técnica de fMRI fornece informações anatômicas mais precisas.
Neste estudo, foram detectadas mudanças de rCBF (regional cerebral flow), isto é,
alterações no fluxo sanguíneo no cérebro de 10 participantes músicos, para examinar as
regiões ativadas em resposta à agradabilidade de 6 versões de uma mesma música
escolhida pelos próprios músicos com variados graus de dissonância. Numa tarefa
23
passiva e sem avaliação, os pesquisadores verificaram que as experiências consideradas
prazerosas (que despertavam frissons e chills) elicitadas pela música eram associadas a
um aumento de atividade e de fluxo sanguíneo no estriado ventral, no mesencéfalo, no
tálamo, na ínsula anterior, no cingulado anterior, no córtex orbitofrontal e no córtex pré-
frontal ventral medial, bem como um decréscimo na atividade da amígdala, quando os
resultados eram postos em contraste com o grupo de controle. Os estímulos com
dissonâncias e considerados desagradáveis mostraram um aumento na atividade da
amígdala e em regiões corticais parahipocampais.
Noutro estudo com PET, Brown e seus colegas (Brown et al., 2004) reportaram
respostas espontâneas em áreas límbicas e para-límbicas durante a escuta passiva para
música instrumental grega não-familiar, mas considerada fortemente agradável pelos
ouvintes, quando em contraste com os resultados obtidos pelo grupo de controle. Foram
observadas ativações no giro cingulado subcaloso, no córtex cingulado pré-frontal
anterior, no córtex restrosplenial, no hipocampo, na ínsula anterior e no núcleo
accumbens. Foi detectada uma maior ativação do hemisfério esquerdo em regiões
límbicas e paralímbicas quando os afetos relatados eram positivos.
Figura 3 - Ilustração de Estruturas Límbicas e Paralímbicas envolvidas na escuta musical.
Enquanto o PET ocupa-se com as alterações funcionais do organismo, o fMRI
encarrega-se de trazer dados mais objetivos sobre os correlatos neuronais das funções
cognitivas através da alteração da oxigenação em regiões encefálicas. Dadas as
limitações da PET - que mede apenas as mudanças hemodinâmicas, com pouca
resolução espacial, evidenciando mais uma atividade neuronal generalizada e menos a
atividade de uma via específica de um neurotransmissor - os estudos subsequentes
priorizaram experimentos com a técnica de Imagem por Ressonância Magnética
24
Funcional – fMRI - que detecta fenômenos mais transientes, cujos resultados se
aproximam um pouco mais do tempo real da atividade cerebral.
b-) Estudos com Imagem por Ressonância Magnética Funcional
(fMRI)
Utilizando técnicas de Ressonância Magnética, Menon e Levitin (2005) fizeram
o primeiro estudo funcional de análise e conectividade efetiva (conectividade funcional
refere-se à detecção da associação ou da interdependência na ativação de regiões
cerebrais) para demonstrar que a música modula fortemente as vias mesolímbicas,
envolvidas na recompensa. Eles estudaram as respostas cerebrais durante a escuta
passiva de música clássica em contraste com versões alteradas. Uma forma de
determinar a conectividade funcional é usar correlações temporais entre eventos
neurofisiológicos espacialmente remotos. Eles encontraram uma ativação significante
das redes de estruturas subcorticais, incluindo o núcleo accumbens e a área tegmental
ventral, bem como o hipotálamo, a ínsula, que se postula estarem envolvidos na
regulação autonômica e nas respostas fisiológicas à recompensa e ao estímulo
emocional. Como já foi observado, o núcleo accumbens é costumeiramente reconhecido
como a principal estrutura do estriado ventral, constituindo uma interface límbico-
motora com um papel central nos circuitos de recompensa cerebral. Cumpre funções
emocionais, motivacionais e psicomotoras (Kandel, 2014).
Esses resultados evidenciam pela primeira vez a ativação efetiva do núcleo
accumbens sem a presença de um estímulo explícito à recompensa, utilizando apenas o
estímulo musical. Esta atividade neuronal é similar àquela encontrada no abuso de
substâncias, como a cocaína, e durante o sexo. Além disso, Menon e Levitin sugerem
que as mudanças hemodinâmicas observadas no estriado ventral estão relacionadas à
ativação da área tegmental ventral (VTA) e poderiam refletir a atividade do
neurotransmissor dopamina.
25
c-) A Dopamina no Prazer Musical
Embora os estudos anteriores tenham verificado a participação de estruturas
relacionadas à recompensa, ainda não havia sido confirmada a participação específica
da dopamina, neurotransmissor de que o sistema de recompensa é altamente
dependente. Para certificar-se da participação do sistema dopaminérgico na escuta
musical, Salimpoor e seus colegas (2011) usaram raclopride, um radio-ligando
específico da dopamina, enquanto executavam a técnica de Tomografia por Emissão de
Pósitrons (PET), e exploraram a atividade dopaminérgica, como um circuito anatômico
distinto que se pensa constituir a base específica de fases da resposta a recompensa. Os
pesquisadores reportaram a liberação de dopamina em porções ventrais e dorsais do
estriado enquanto os ouvintes tinham experiências de chill e frisson escutando músicas
consideradas agradáveis, em contraste com as imagens daquelas para quem a
experiência era considerada neutra.
Porque os dados obtidos com o procedimento PET não fornecem informação
sobre a dinâmica temporal, os mesmos participantes foram testados com o mesmo
estímulo usando fMRI, que detectou uma ativação bifásica das estruturas relacionadas à
dopamina. Uma dissociação funcional nas ativações BOLD foi observada entre as
porções ventrais e dorsais. A resposta hemodinâmica BOLD associada à porção dorsal
foi observada anteriormente ao chill, enquanto os ouvintes antecipavam o prazer
máximo. Por conseguinte, a ativação da porção ventral foi encontrada durante os picos,
nos momentos em que o chill era reportado ou medido pelos mecanismos de
mensuração fisiológica. A ativação da porção dorsal é associada à codificação da
expectativa ao chill, enquanto a porção ventral é associada à resolução da expectativa.
Deste experimento, obtemos os indícios de que não há somente liberação de
dopamina durante os picos de prazer na escuta musical, mas também em antecipação a
estes momentos. Esses dados avalizam nossa hipótese de que a antecipação tem um
importante papel na apreciação musical.
26
5. O Envolvimento de Áreas Corticais
O prazer musical é fruto de uma série de habilidades cognitivas de alta
complexidade, numa ação orquestrada de processos corticais integrados com os
sistemas de motivação e recompensa (Zatorre, 2015).
Abaixo, uma síntese desses processos:
a-) Córtex Orbito-Frontal Medial: Processamento e Avaliação
Emocionais
Osuch e seus colegas (2009) detectaram um grande envolvimento do córtex
orbitofrontal medial (COF-m) e do estriado ventral em sujeitos normais quando estes
escutavam suas músicas preferidas, em comparação com os resultados encontrados em
pacientes com depressão. Estas estruturas são relacionadas ao processamento emocional
e avaliação de alto nível para recompensa e punição. O córtex orbito-frontal é também
relacionado à integração sensorial, à criação de expectativas, à tomada de decisão e
experiências hedônicas (Zatorre, et al).
b-) Córtex Temporal Superior: Percepção
De acordo com Salimpoor (2014), o córtex temporal superior, onde estão
sediados os córtices auditivos primário e secundário, envolve-se em uma série de tarefas
auditivas importantes ao processamento musical, incluindo o processamento e detecção
do pitch (altura) e a determinação de relações tonais. Postula-se que esta área retenha
uma série de templates sonoros que são acumulados ao longo dos anos. A informação
auditiva armazenada nesta região é associada ao imaginário e à familiaridade com a
música. A informação armazenada nos templates serve de base à geração de
expectativas durante a escuta de novos padrões (Salimpoor, 2014). É sugerido que
quando entramos em contato com músicas nunca antes ouvidas, os templates guardados
nesta região são acessados, gerando expectativas de como será o desdobramento da
sequência sonora.
Num estudo relacionando a ativação do núcleo accumbens, Salimpoor (2013)
encontrou uma robusta conectividade entre o Córtex Temporal Superior e o núcleo
accumbens. Esta conectividade sugere a existência de um mecanismo pelo qual as
27
expectativas (baseadas nos templates previamente armazenados na memória através da
experiência musical) se conectam ao sistema de recompensa, confirmando ou
sinalizando erros de predição.
c-) Córtex Frontal Inferior: Sequenciamento Temporal de Alto
Nível
O cérebro humano está constantemente prevendo acontecimentos no ambiente
sonoro em que se insere por similaridades de representações sequenciadas. É proposto
que as regularidades simples são extraídas em estações mais baixas do córtex auditivo,
enquanto as mais complexas são extraídas pelo córtex pré-frontal. Para reconhecer a
estrutura subjacente à música, o que habilita a predição, é necessário um
sequenciamento estrutural da informação sonora (Salimpoor, 2015). Esse processo é
continuamente atualizado, refinado e revisado, conforme novas informações vão
chegando aos sentidos. O córtex frontal, mais especificamente sua porção inferior
direita, é a área cerebral tipicamente associada ao processamento de aspectos estruturais
da música, conforme Sammler (2011).
6. Integração de Regiões Cerebrais na Apreciação Musical
Os estudos revistos mostraram uma intensa participação de regiões corticais e
subcorticais no processamento e na apreciação musical. Esses processos parecem ser
dependentes uns dos outros no sentido de proverem feedback e atualização para o
processamento musical (Salimpoor, 2015). Estudos de conectividade funcional e
anatômica oferecem suporte para o modelo integrativo, proposto por Zatorre e
Salimpoor (Ibidem).
a- O córtex orbitofrontal e o córtex pré-frontal ventromedial, áreas envolvidas no
processamento de alto nível e avaliação do estímulo, constituem o principal
input no núcleo accumbens.
b- A amígdala, envolvida no processamento emocional, conecta-se diretamente ao
córtexorbito frontal, ao córtex pré-frontal ventromedial e ao núcleo accumbens.
c- O núcleo accumbens se projeta diretamente nos núcleos da base no encéfalo
frontal, que por sua vez se projeta ao córtex e à amígdala, de modo que
atividades do núcleo accumbens impactam estas regiões.
28
Abaixo, um breve esquema sobre como dividem-se as tarefas cerebrais que
habilitam a predição durante a escuta musical.
Figura 4 - Desenho esquemático dos processos cerebrais que habilitam a predição durante a escuta musical. Autora da
tese.
No apêndice desta tese consta a tabela com todos os trabalhos selecionados na
revisão sistemática de literatura, a metodologia aplicada por cada um, o tipo de
estímulo, a tarefa executada pelos participantes, bem como as ativações encontradas e
resultados mais significativos.
7. Conclusão
As evidências empíricas encontradas na literatura abordada avalizam a premissa
que conduz esta dissertação, uma vez que a escuta musical é um forte modulador da
atividade do sistema mesolímbico, especialmente do núcleo accumbens. Os estudos de
neuroimagem demonstraram a relação causal entre a ativação da via mesolímbica
(fulcral para a experiência da recompensa) e a escuta musical. Ou seja, a via
dopaminérgica é fortemente modulada pela escuta de músicas consideradas agradáveis
pelos ouvintes.
A bibliografia também evidenciou a participação de áreas corticais e subcorticais
no processamento musical, responsáveis pela percepção e armazenamento de templates
(córtex temporal superior), sequenciamento temporal de alto nível (córtex frontal
29
inferior), avaliação do estímulo e processamento emocional (córtex orbitofrontal
medial).
Um dos trabalhos que consideramos de destaque nesta revisão foi o estudo de
Salimpoor (2011), que evidenciou o disparo bifásico de dopamina nas vias
mesolímbicas e na área tegmental ventral, antes e durante o prazer máximo relatado
pelos participantes. Este achado oferece fortes razões para a interpretação do prazer
musical de acordo com o modelo do Ciclo do Prazer (Berridge, 2006), performado pela
apreensão, a geração de expectativas e a resposta hedônica (orquestrada pelo núcleo
accumbens através da liberação de opióides μ) que acaba por conduzir-nos ao modelo
de Codificação Preditiva.
Porque o prazer é um estado positivo, tende a ser reforçado para que o
comportamento bem sucedido seja repetido e conduza a um resultado desejável e
favorável para os organismos, isto é, adaptativo. No reino animal, a via mesolímbica é
filogeneticamente muito antiga e serve para reforçar comportamentos biologicamente
significantes, como o sexo, a alimentação, a interação social e o cuidado parental
(Zatorre, 2011).
Entretanto, a música – bem como outros estímulos estéticos - não é idêntica a
estes estímulos de primeira ordem que são estritamente necessários à sobrevivência ou à
manutenção de um equilíbrio fisiológico (Zatorre, 2015). Então, por que o sistema de
recompensa é ativado e sente-se prazer escutando música?
Será oferecida uma proposta de resposta a tal pergunta nas próximas secções, a
partir da Hipótese das Expectativas de Meyer, segundo a qual o gosto que temos pela
escuta musical advém das expectativas que ela nos permite criar sobre seu desenrolar.
31
1. Breves Noções sobre o Sistema Tonal
a-) O Sistema Tonal
“Som é presença e ausência e está permeado de silêncio”.
José Miguel Wisnik em O Som e o Sentido
Antes de adentramos nos pormenores da formação de expectativas musicais, faz-
se cabalmente necessário esclarecer o recorte acerca do fenômeno musical que
abordamos nesta tese: o tonalismo. Tal forma composicional foi a principal
característica da música ocidental nos últilmos 300 anos. Ainda que venha sofrendo
uma série de abalos e críticas no contexto da música erudita e experimental, é
reconhecidamente hegemônica no âmbito da música popular do século 20 (Valverde,
2017).
No século XX, o século da canção, as estruturas musicais
abandonadas pelas pesquisas de vanguarda migraram da
produção erudita para as formas musicais típicas da cultura
popular urbana, que passou, assim, a ser o último reduto da
tonalidade. Neste contexto, o desenvolvimento de qualquer
fraseado musical obedece a uma dinâmica atrativa, que faz tudo
girar em torno do centro tonal e dá ao ouvinte a sensação de
reconhecer aquele desenho sonoro como uma narrativa musical
e antecipar a conclusão, como repouso e retorno ao ponto de
partida. Além disso, por estar centrada na melodia, a canção
economiza o desenvolvimento e a variação que, nas formas
musicais mais complexas, adiam o repouso que será
proporcionado pelo retorno ao centro tonal. Dessa forma,
tornando o percurso narrativo ainda mais simples e
concentrado, a canção atinge a enorme pregnância que a
caracteriza. (Valverde, M., 2017)
A música tonal, em sentido lato, é aquela que reconhece uma hierarquia de altura
entre notas. Trata-se de um sistema restrito de regularidades com base em um número
limitado de elementos. Este sistema é altamente dependente de uma estrutura
geométrica formal que determina as relações de distância dentro de um espaço
harmônico. Segundo Tillmann (2010), há três níveis de hierarquias que performam a
fonte das regularidades tonais: a nota, o acorde e o tom.
Nesta secção, serão apresentadas algumas noções musicais de suma importância
para o entendimento do idioma tonal como gramática. A natureza do som será tratada de
forma sumária não apenas pelo viés a físico-acústico, mas também pela perspectiva
musical.
32
b-) A Série Harmônica
Em O Som e o Sentido, Wisnik define som como uma onda longitudinal que se
propaga em meios materiais (no caso, o ar) captada pelo tímpano auditivo. Este registra
em seus sensores as oscilações como séries de compressões e descompressões. As
oscilações podem ter velocidades variadas. A altura do som (frequência) é definida pela
velocidade de propagação da onda. Quanto mais rapidamente ela vibrar, mais agudo
será o som. Na mesma ordem, quanto mais lenta for a vibração de uma onda, mais grave
é o som que ela emite. A unidade de medida da frequência de uma onda sonora é o
Hertz, o número de oscilações por segundo. Por exemplo, uma onda sonora cuja
frequência é 32HZ vibra 32 vezes por segundo.
Contudo, uma onda musical natural não é composta apenas por uma frequência.
Ela é uma combinatória da justaposição de outras frequências, cuja fundamental é
aquela que se ouve predominantemente (Wisnik, 1989). Ela é complexa, composta por
frequências de diferentes intensidades que se superpõem, interferem e complementam
entre si: os harmônicos, que não são frequências aleatórias! Existe uma relação
estabelecida a partir da fundamental e que se aplicará a qualquer som harmônico,
independente de qual seja a frequência fundamental.
Série harmônica é a relação constante e progressiva que se dá entre a
frequência fundamental e suas constituintes. Por exemplo: se a frequência fundamental
é F, os harmônicos correspondentes a ela terão frequências 2F, 3F, 4F, 5F e assim por
diante. Vejamos abaixo uma representação gráfica desta relação:
33
Figura 5 - Representação de uma série harmônica – Wisnik, J. M. (2014).
Para exemplificar: se uma nota tem frequência de 16HZ, seu segundo harmônico
possui duas vezes essa frequência: 32HZ. A cada vibração da nota fundamental, o
segundo harmônico vibrará duas vezes. Ambas as notas se chamam Dó, entretanto, a
segunda nota é mais aguda e se encontra uma oitava acima. Harmônicos são a mesma
nota em diferentes alturas. Essa relação se aplicará a qualquer som: todas as frequências
que se relacionem na razão 2:1 (e, por conseguinte, as razões 4:1, 8:1, 16:1, 32:1, etc.)
são percebidas como a mesma nota musical, evidenciando que a percepção musical é
cíclica (Wisnik, 1989).
c-) A Escala Cromática
Na música tonal ocidental, as 12 notas da escala cromática são combinadas de
uma forma muito restrita. Ela é formada pelas notas: C, C#|Db, D, D#|Eb, E, F, F#|Gb,
G, G#|Ab, A, A#| Bb (Dó, Dó Sustenido ou Ré Bemol, Ré, Ré Sustenido ou Mi Bemol,
Mi, Fá, Fá Sustenido ou Sol Bemol, Sol, Sol Sustenido ou Lá Bemol, Lá, Lá Sustenido
ou Si Bemol e Si).
Este conjunto de 12 sons é organizado em subconjuntos de 7, também
conhecidos como Escalas Diatônicas. Dependendo do arranjo de intervalos que separa
as sete notas, a escala diatônica pode ser Maior ou Menor.
Para a escala maior, o padrão de organização das notas é: tom, tom, semitom, tom, tom,
tom, semitom. Para a escala menor: tom, semitom, tom, tom, semitom, tom, tom.
34
Figura 6 - Escala Cromática em sentindo crescente e decrescente de altura.: M. (2013, March 19). Retrieved October
23, 2017, from https://www.youtube.com/watch?v=IbgOcXar9UA
O sistema tonal é dotado de duas propriedades: a horizontalidade e a
verticalidade. Horizontalidade é a sucessão dos sons através do tempo e se relaciona
com a melodia3. Verticalidade é a possibilidade de os sons serem tocados
simultaneamente. Para compreendermos as noções de acordes e de harmonia,
precisamos lançar mão da ideia de verticalidade.
d-) Os Acordes
Acordes formam a segunda ordem de unidade musical (a primeira são as notas).
Eles são a execução de três ou mais notas ao mesmo tempo. Tríades são acordes de três
notas que quando tocadas simultaneamente estabelecem um relacionamento harmônico
específico entre si. Para esta tese, manteremos o foco nas tríades maiores, que servem
de base para os experimentos com redes neurais vistos na sequência, apesar da
existência de variados tipos de acordes: acordes menores, acordes de sétima, acordes
estendidos ou acordes com nota adicionada.
A construção dos acordes é motivada pelas relações acústicas de harmonia entre
as frequências. Tríade Maior: são acordes formados pela tônica, a terça e a quinta da
escala em questão. É considerada a mais natural e mais consonante, pois envolve notas
que estabelecem relações de harmonia entre si. Tríade Menor: são acordes formados
pela tônica, a terça menor e a quinta da escala, um tanto mais dissonante que o acorde
3 Melodia é uma relação horizontal, trata-se da sucessão de notas e acordes em intervalos ritmados.
35
maior. A escolha entre as terças maiores e menores é o que definirá a natureza do
acorde.
e-) O Tom
Tom é a terceira ordem de unidades musicais. Refere-se à nota que define a
sensação de repouso dentro de uma escala. Schöenberg (1975) definiu os ciclos de
tensão e repouso como a base perceptiva do idioma tonal. São eles que conferem ao
sistema as probabilidades estatísticas para a formação expectativas com suas
subsequentes respostas neurofisiológicas orquestradas pelo sistema nervoso (Huron,
2006). De posse desta noção de estabilidade e tensão, é possível compreender o
conceito de tonalidade: uma série de relações hierárquicas entre notas que possibilita a
tensão (a instabilidade, o movimento) e o relaxamento ou repouso, a estabilidade. O
movimento musical é como o movimento do corpo, uma sucessão de instabilidades e
estabilidades. Ao lançarmos a perna para frente, desestabilizamos o corpo. Em seguida,
voltamos a estabilizá-lo com o passo da outra perna. É dentro deste ciclo que o
movimento se processa e o mesmo ocorre na música. A tônica é a nota que devolve a
estabilidade a uma escala. Todas as outras notas têm sua função em relação a ela, de
acordo com o grau de tensão e relaxamento que exercem dentro da escala. É trivial que
notas de maior relaxamento são mais consonantes e as de maior tensão são consideradas
dissonantes. Na escala maior, o primeiro grau é denominado tônica. O segundo, super-
tônica. O terceiro chama-se mediante (porque está entre a tônica e a dominante). O
quarto é chamado de subdominante (posto que precede a dominante). O quinto grau é o
dominante (pois domina a tônica e exerce um papel de extrema tensão, chamando pela
resolução tônica, ele exige por ela). O sexto é superdominante. E o sétimo grau é
chamado sensível, pois conduz até a tônica ascendente. Diz-se que notas “chamam” a
tônica porque formam com ela intervalos de semitom bastante dissonantes, logo, de alta
tensão que demandam uma forte estabilidade.
Pegando como exemplo a escala de Dó Maior (Dó, Ré, Mi, Fá, Sol, Lá, Si),
temos como tônica o próprio Dó. Ele é o ponto de partida. Todas as outras notas têm
seus intervalos demarcados e nomeados em função da tônica.
36
Tônica: Dó
2º GRAU: Dó-Ré: segunda maior (dois semitons)
3º GRAU: Dó-Mi: terça- maior (quatro semitons)
4º GRAU: Dó – Fá: quarta justa (cinco semitons)
5º GRAU: Dó – Sol: quinta justa (sete semitons)
6º GRAU: Dó – Lá: sexta maior (nove semitons)
7º GRAU: Dó – Si: sétima maior (onze semitons)
Dó – Dó: oitava justa (doze semitons)
f-) O Ciclo de Quintas
Para compreendermos melhor as relações de consonância e dissonância entre as
cromas4, vamos recorrer ao Círculo de Quintas, em que as 12 notas são concebidas
espacialmente num círculo que descreve suas relações de consonância. No Círculo de
Quintas, as notas são dispostas de modo que a relação mantida com a anterior e a
seguinte são de quinta justa. O intervalo de uma quinta justa é significativo, pois é o
intervalo de maior consonância entre duas notas distintas (maior que este apenas entre
oitavas). O número de passos que separa duas notas neste círculo (sem importar a
direção de rotação) define as distâncias harmônicas entre elas. Estas distâncias formam
a base das fortes regularidades das peças musicais da música Ocidental (Bigand, 2000).
Vejamos o Círculo de Quintas:
4 Croma: “a qualidade compartilhada por todos os sons tônicos que se identificam pela oitava e seus
desdobramentos em distintas regiões no âmbito das alturas, e que por isso são denominadas como sendo a
mesma nota, independente se suas frequências são maiores ou menores”. Disponível em: Filho, F. M.
(2004). acústica musical em palavras e sons. Cotia, : teliê.
37
Figura 7- Ciclo de Quintas representando as distâncias entre os tons maiores. Tillmann, B., Bharucha, J. J., &
Bigand, E. (2001)
Estas relações tonais entre as notas de uma escala estabelecem as tensões
musicais e os relaxamentos. Por exemplo: as notas que se encontram em posições
diametralmente opostas no Círculo de Quintas mantêm entre si uma forte relação de
dissonância. Essas relações são responsáveis pela geração de expectativas sobre o
movimento musical (Tillmann & Bharucha, 2010).
2. Experimento Probe-Tone
Carol Krumhansl (1979) desenvolveu um estudo sobre como é estabelecido o
senso de tom, sobre como as notas encaixam-se dentro de um determinado contexto
melódico. Ela queria quantificar a hierarquia das funções tonais dentro do contexto
diatônico, o “quão bem” uma nota encaixa-se numa sequência e qual nota finaliza
melhor uma sequência, isto é, mensurar a expectativa gerada pela audição de uma escala
incompleta de tons sucessivos.
No estudo denominado Probe-Tone dois experimentos foram desenvolvidos. Em
ambos, o contexto era criado usando escalas ascendentes e descendentes de Dó maior.
Os participantes eram divididos em dois grupos de acordo com suas competências
musicais. No primeiro experimento foram utilizados sons sintetizados complexos
(formados por mais de uma frequência). No segundo, sons sinusoidais (formados por
uma só frequência). Em ambos, os participantes ouviam uma escala incompleta de Dó
maior. Esses fragmentos possuíam a omissão da última nota (a nota a ser avaliada),
onde deveriam julgar a adequação da nota que completaria a sequência, oferecendo às
notas valores numéricos entre 1 e 7 (muito ruim a muito bom).
38
No geral, os resultados evidenciaram que notas que geram mais estabilidade são
as mais esperadas. Krumhansl detectou que a experiência musical era um fator
determinante para as expectativas dos participantes. O primeiro intervalo entre notas (de
razão 2:1), mais próximo da frequência fundamental, é o mais consonante de todos e o
mais aguardado. No grupo de maior instrução musical, a tônica foi mais bem avaliada,
não importando a oitava em que se encontrasse e independentemente do contexto
ascendente ou descendente. No grupo com menor instrução, a tônica foi avaliada como
a nota de maior estabilidade, porém com menor incidência em oitavas diferentes.
Figura 8 – Resultados de Krumhansl, C. L., & Cuddy, L. L. (2010). A Theory of Tonal Krumhansl, C. L., & Cuddy,
L. L. (2010).
O segundo intervalo mais consonante (de razão 3:2, Sol) foi também o segundo
mais aguardado. Ele envolve duas notas diferentes - entre o 2° e o 3° harmônicos - de
nome de Quinta Justa (5ªJ). Já o terceiro intervalo mais consonante (de razão 4:3),
formado entre o 3º e o 4º harmônicos, formaliza um intervalo de quarta justa (4ªJ) e foi
a terceira nota aguardada (Mi).
Abaixo, o sequenciamento da consonância entre notas:
Figura 9 - Sequenciamento dos tons mais aguardados
39
Os experimentos de Krumhansl demonstraram a dependência entre a formação
de expectativas melódicas e o grau de treino musicale refletem - entre outros fatores - a
influência quantitativa da exposição ao material sonoro para a modulação da
expectativa.
De posse destas breves ideias de tonalidade e da noção mais basal de expectativa
tonal, faz-se possível a compreensão dos capítulos subsequentes.
41
"Penso que a busca de uma resposta universal para
questões levantadas pela experiência musical nunca
será completamente respondida; Mas sabemos que uma pergunta
suscitada é muitas vezes mais significativa do que a resposta
recebida. Apenas um espírito imprudente, hoje, tentaria
dar uma explicação total para a música, mas qualquer um que
nunca coloque o problema é ainda mais imprudente.”
(Lúcio Deiro)
1. Introdução
Nas secções anteriores, foram investigadas as ativações de níveis basais do
sistema nervoso que conduzem à geração de recompensa na escuta musical. Também
introduzimos breves noções sobre o funcionamento acústico das regularidades do
sistema tonal e comentamos o experimento de Krumhansl a respeito das expectativas
mais elementares geradas sobre este.
Nesta próxima grande secção, vamos lançar luz sobre os recursos cognitivos que
possibilitam o comportamento estatístico do cérebro tornando-o capaz de gerar
expectativas e fazer predições sobre o fenômeno musical, que suportam as asserções
musicológicas de Meyer para sua a fruição.
2. Neuropsicologia das Expectativas Musicais
2.1. Música e Efeito Priming
O efeito priming refere-se às situações em que o processamento de informações
iniciais influenciará processamento de informações subseqüentes. Os estudos do efeito
prime buscam compreender o modo como um estímulo inicial (prime) pode afetar as
respostas a estímulos posteriores, sem que exista consciência sobre tal influência. A
literatura aponta a incidência do efeito em percepções e comportamentos, podendo
implicar em alterações nas motivações, avaliações, julgamentos ou decisões (Laran et
al., 2011).
Prime é um tipo de memória implícita responsável pela melhoria na percepção
de estímulos encontrados em experiências recentes, em que há um aperfeiçoamento na
velocidade ou na eficiência da percepção (Squire & Kandel, 2003), guiados pelo
princípio da parcimônia na natureza aplicado à economia da energia livre do cérebro
(Karl, F., 2012). Por exemplo, ao ler uma lista de palavras, será mais fácil, ou seja, mais
42
rápido, com menor incorrência de erros e com menos gasto de recursos após uma
primeira leitura desta lista.
Os estudos pioneiros sobre o efeito priming demostraram que numa tarefa de
decisão lexical (em que os participantes deveriam indicar o mais rápido possível se uma
seqüência de letras é uma palavra real ou não) os sujeitos respondiam muito mais
rapidamente se a palavra-alvo relacionava-se semanticamente com as outras. A hipótese
dominante para explicar esse efeito é que a memória seja organizada em redes
semânticas associativas. Os estímulos deotados de conexões semânticas serão mais
fortemente associados do que as representações de eventos não relacionados
semanticamente.
Bharucha e colegas foram os primeiros a adaptarem o paradigma do priming
para o campo musical (Bharucha & Stoeckig, 1986, 1987). Eles realizaram um estudo
em que os participantes precisavam decidir sobre um acorde-alvo que seguia um acorde
inicial. Segundo Bharucha (1986), as expectativas podem ser estudadas medindo-se o
tempo para discriminar o acorde-alvo (se bem ou mal adaptado) em relação ao prime.
Este paradigma de tem sido usado para demonstrar que os alvos consonantes são
processados mais rapidamente e são percebidos como mais consoantes do que os alvos
que não se relacionam em tonalidade. Como percebemos no capítulo sobre tonalidade,
um acorde dissonante (instável) demanda acordes consonantes (que devolve a
estabilidade) relacionados a ele.
Em metade dos ensaios, a altura de uma das notas do acorde-alvo foi
ligeiramente reduzida, e os participantes foram solicitados a relatar com precisão - e tão
rápido quanto possível - se o acorde-alvo era consonante ou dissonante ao contexto em
que se inseria. A variável de interesse no estudo era a relação harmônica mantida pelos
dois acordes (prime e alvo), definidos de acordo com a teoria musical. A função
harmônica dos acordes e as relações que mantêm variam de acordo com a escala de tom
em que aparecem. Na condição de consonância, os acordes compartilham o tom,
enquanto a condição de dissonância não estavam no mesmo tom.
Os autores relatam que o tratamento dos acordes-alvo foi melhor e mais rápido
na condição de tom relacionado do que em comparação com a condição menos
conectada. Quando o contexto, ou seja, o acorde que precede o alvo é mantido
constante, o contexto harmônico global influenciará o tratamento desse alvo. Há um
43
tratamento perceptivo facilitado do acorde-alvo que detém relações tonais com o prime,
quando comparado a um acorde não relacionado.
Para entender melhor esse efeito facilitador, Tillmann e colegas (2003)
exploraram o tratamento perceptual das três funções mais importantes da hierarquia
harmônica (I, IV e V). Eles confirmaram que o tempo de resposta dos participantes
refletia a hierarquia: o tratamento do alvo foi o mais rápido para o acorde tônico,
seguido pelo acorde dominante e, finalmente, o subdominante. A comparação com um
contexto de fundo neutro (em que nenhum centro tonal é estabelecido) mostrou
benefício do tratamento da tônica e um custo no tratamento da subdominante. Estes
resultados sugerem que os ouvintes possuem um conhecimento implícito detalhado da
hierarquia harmônica e confirmam o status especial do acorde tônico no final de um
contexto tonal.
a-) A Memória como Fonte das Expectativas Musicais
Do ponto de vista da evolução, a incorporação do aprendizado e do acesso à
memória de eventos tem menos o papel de reviver o passado e mais a função de prever
o futuro, uma vez que o acesso à memória permite a antecipação de eventos já
experenciados (Dennet, 1996).
Segundo Salimpoor (2015), existem duas fontes principais de expectativas para a
experiência musical: o conhecimento explícito e conhecimento implícito, posto que o
aprendizado - bem como sua evocação - podem ou não ser conscientes (Reber, 1967;
Dienes & Berry, 1970).
Esses dois conhecimentos em conjunto fornecem o material cognitivo que
servirá de base para as predições a respeito do desenrolar musical.
b-) Memória e Conhecimento Explícito da Música
A memória explícita caracteriza-se por ser uma lembrança consciente e
voluntária de informações ou eventos passados. O conhecimento explícito no contexto
musical é adquirido através da escuta anterior de determinada peça, e é acessado pela
memória episódica (Salimpoor, 2015). É um conhecimento declarativo (Tillman, 2000)
adquirido sobre uma música familiar e que leva ao conhecimento de como a música se
desenrolará. É relatado que a familiaridade é importante para níveis mais elevados de
44
agradabilidade musical, evidenciando que o conhecimento explícito pode aumentar o
prazer nos ouvintes (Bosch, 2013).
Bosch (2013) conduziu um estudo correlacionando as medidas de condutância
da pele em dois experimentos: um deles medindo a respostas a músicas desconhecidas e
outro depois que os 60 sujeitos do experimento entraram em contato com as peças. Os
pesquisadores descobriram que a resposta ao prazer medida pela condutância da pele foi
maior quando o estímulo foi ouvido pela segunda vez, isto é, quando era mais familiar
para o ouvinte. Noutro estudo, Szpunar et al. (2004) também sublinhou a relação
positiva entre exposição e preferência, utilizando sequências musicais (excertos de
gravações de concertos) e sequências artificiais. Comparando exposições, com foco na
exposição incidental, ele detectou que a agradabilidade era maior nos excertos escutados
previamente.
c-) Memória e Aprendizados Implícito e Estatístico na Música
Apesar de mais de 40 anos de pesquisa, o debate sobre o aprendizado é
permeado por controvérsias a respeito da necessidade do recrutamento de recursos
atencionais para a produção de conhecimento (Neal & Heasketh, 1997).
Uma corrente defende que o aprendizado e a consciência do que foi aprendido
estão perfeitamente e necessariamente correlacionados. Para esta corrente, o
aprendizado só pode ser alcançado por um único mecanismo que gera representações na
memória do aprendiz que está sempre ciente. De acordo com esta proposta, a
aprendizagem implícita não existe (Vokey & Brooks, 1992).
Contudo, em 1955, Gibson faria a primeira elaboração a respeito do aprendizado
implícito, ao qual ele denominou “aprendizado perceptual”, embora sejam atribuidas a
Reber (1967) os primeiros experimentos acerca do tema. Reber advoga que a
experiência consciente forma a base da aprendizagem explícita, porém, a aprendizagem
implícita demonstra a aquisição de conhecimento abstrato sobre as regularidades
estatísticas dentro de um ambiente de aprendizagem que ocorre fora da consciência,
insensível ao controle intencional e ao ato declarativo (Reber, 1989).
Para Dienes e Berry (1997), o aprendizado implícito conduz a um conhecimento
que não é automaticamente representado como conhecimento para o processo de
aprendizagem. Nesses termos, a aprendizagem implícita ocorre quando uma pessoa
aprende sobre um estímulo complexo sem necessariamente pretender fazê-lo, isto é, de
45
tal forma que o conhecimento resultante é difícil de expressar (Rünger, 2003).
Underwood (1996) também defende a ideia de um tipo de processamento de informação
sem a participação de recursos atencionais ou da consciência.
Dienes e Berry (1997) sistematizaram essas colocações, estabelecendo quatro
componentes essenciais à aprendizagem implícita:
Inacessibilidade ao conhecimento por free-recal ou testes de escolha;
Condições incidentais de aprendizagem;
Origina um senso de intuição para aqueles que executam a tarefa;
Mantém-se robusta, apesar da execução de tarefas secundárias, do passar
dos anos e de possíveis transtornos.
Os mecanismos acionados em situações de aprendizagem incidental são de
potencial interesse a muitos campos de pesquisa, incluindo aquisição de idiomas,
formação de conhecimento de objetos e aprendizagem motora. Entretanto, um enfoque
diferente da interpretação de Reber foi oferecido por Saffran (2010) e seus
colaboradores. Chama-se Aprendizado Estatístico e possui muitas interconexões e
conceitos sinônimos com o aprendizado implícito (Perruchet & Pacton, 2006).
De acordo com Romberg & Saffran (2010), os humanos, incluindo os bebês,
são altamente sensíveis à estrutura do ambiente. Tanto o aprendizado implícito quanto o
aprendizado estatístico implicam a descoberta de padrões no input, um processo de
extração dos padrões da estrutura circundante. Este tipo de aprendizado diverge
cabalmente do aprendizado supervisionado encontrado no condicionamento operante (o
aprendizado de que um determinado comportamento leva ao reforço por recompensa ou
à punição).
Os tipos de padrões monitorados por um mecanismo de aprendizado estatístico
podem ser bastante simples, como a contagem de frequência de um estímulo, ou mais
complexos, como a probabilidade condicional (Romberg & Saffran, 2010). Da mesma
forma, os elementos sobre os quais os cálculos são feitos podem variar em
complexidade, como formas e faces geométricas; ou em concretude, como sílabas e
categorias sintáticas (Ibidem).
Vasuki (2017) descobriu que as crianças treinadas musicalmente apresentaram
melhor melodia, melhor ritmo, melhor discriminação de frequência e foram melhores
em tarefas de memória em experimentos de aprendizado estatístico. Dois grupos de 25
crianças de 9 a 11 anos participaram do experimento. Um grupo realizou aulas
46
particulares de música durante pelo menos 18 meses, enquanto o outro não. As
varreduras EEG mostraram que as crianças treinadas musicalmente detectaram padrões
em tarefas auditivas e visuais mais rápido do que aquelas sem treinamento musical.
Conforme Vasuki, as crianças expostas a pelo menos um ano e meio de aulas de música
são mais capazes de detectar padrões no mundo ao seu redor. Os dados sugerem que as
diferenças individuais nas habilidades musicais estão associadas à capacidade de
detectar regularidades.
d-) Experiências de Aprendizagem com Gramáticas Artificiais
Os seres humanos são capazes de aprender através de dois sistemas: o
aprendizado explícito e o aprendizado implícito. O último é possível graças às
propriedades bayesianas do funcionamento cerebral, que será comentado mais adiante.
Parte do trabalho que estuda a aprendizagem explícita usa o paradigma de
aprendizagem de gramáticas artificiais desenvolvido por George Miller (1958). Neste
paradigma, um conjunto de seqüências de letras é gerado usando um conjunto de regras
que governam formação e o comprimento de strings. Esta pesquisa demonstrou que era
mais fácil lembrar uma sequência de gramática estruturada do que de uma sequência
aleatória de letras.
Reber (1969) adotou o paradigma de Miller para estudar a aprendizagem
implícita, apesar de reconhecer que materiais artificiais são muito mais simples que as
sequências de eventos ambientais. Todavia, Reber afirma que alguns princípios básicos
da aprendizagem podem servir de modelo para a compreensão do aprendizado implícito
em ambientes naturais.
Reber expôs os participantes a um conjunto de strings geradas por uma
gramática específica. Para garantir a aprendizagem implícita, os participantes foram
enganados para acreditarem que em algum momento haveria um teste de memória para
essas strings. Ao final do teste foi revelado que os strings seguiam algum conjunto de
regras para a formação e os participantes foram convidados a discriminar entre strings
gramaticais e agramaticais. Após a exposição de dois strings válidos, o desempenho dos
participantes em testes de julgamento de gramática foi acima do esperado. Os
participantes não podiam verbalizar como estavam realizando a distinção, o que levou
Reber a concluir que o conhecimento aprendido sobre a gramática havia sido adquirido
através de um sistema implícito.
47
Atualmente, o cerne das preocupações dos estudos em Aprendizagem com
Gramáticas Artificiais 5 tem sido descobrir quais mecanismos as crianças utilizam para
adquirir a língua nativa. O aprendizado incidental da linguagem é bastante estudado em
laboratório com o uso de material artificial, baseado em regularidades estatísticas.
Diversas gramáticas artificiais foram geradas para compreender a aquisição da
linguagem (Saffran, 2002).
Abaixo, um exemplo de gramática de estado-finito que vem sendo largamente
utilizada nos estudos de aprendizagem implícita. No experimento, os participantes
mostraram-se capazes de captar as regras de formação de strings e distinguir entre
palavras e não palavras pertencentes à gramática de estado-finitos criada sem o
conhecimento deles. Os participantes foram capazes de discriminar os novos excertos e
os excertos agramaticais.
Figura 10- Típica gramática de estados finitos utilizada em experimentos de aprendizagem implícita. Disponível em Perruchet, P., &
Pacton, S. (2006). Implicit learning and statistical learning: one phenomenon, two approaches. Trends in Cognitive Sciences,
A linguagem de estados-finitos acima contém 10 letras (S, H, F, V, R, T, D, X,
M, P) que são regidas por um conjunto de regras de construção de sentença,
constituindo uma gramática que pode ser caracterizada como um processo markoviano6,
na qual a transição de estados produz uma letra. As três setas da esquerda representam
diferentes estados iniciais. As letras são produzidas pelas transições entre os nós e as
5 Artificial Grammar Learning (AGL)
6 Processo Markoviano: é um processo que possibilita fazer previsões para o seu desenvolvimento futuro
com base apenas em seu estado atual, independentemente de sua história. É condicional ao estado atual
do sistema, porém, seus estados futuros e passados são independentes. (via wikipedia:
https://en.wikipedia.org/wiki/Markov_chain, acessado em 19/08/2017).
48
setas indicam os caminhos possíveis para formação de sentenças. A sentença é
finalizada quando alcança alguma das três setas de saída à direita que representam
estados finais aceitáveis para esta gramática. A linguagem desta gramática é constituída
por todas as sentenças que ela pode produzir.
Conforme Ettlinger (2011), as associações entre memória implícita e
aprendizado de linguagem podem ser estendidas à música, por compartilharem uma
série de mecanismos cognitivos e neurais, como veremos mais adiante. Contudo, a
gramática da música tonal é bem mais complexa que uma gramática de estados-finitos
usada em experimentos sobre a aquisição da linguagem. Assim, Barbara Tillmann &
Poullin-Charronnat (2001, 2010) fizeram experimentos com gramáticas musicais
artificiais que podem fornecer indícios sobre o aprendizado incidental e sobre a
aquisição de conhecimento de estruturas subjacentes ao sistema tonal através da mera
exposição.
No estudo de 2010, Barbara Tillmann & Poullin-Charronnat, em vez de
trabalharem com strings de letras, desenvolveram uma gramática artificial baseada em
um conjunto de tons (formando seqüências de tom) de escala temperada, a fim de
investigarem a aprendizagem implícita no contexto musical:
Figura 11 - Gramática de estados-finitos para experimentos sobre aprendizagem implícita no contexto musical
(Tillmann & Charronnat, 2010).
Em uma primeira fase do experimento, os participantes foram expostos a
seqüências de tons (geradas com base na gramática de estados finitos mostrada na figura
acima) e realizaram um experimento de tarefa de memória. Num segundo momento, foi
realizada uma tarefa de detecção de tons “agramaticais”, com notas desafinadas. Os
participantes deveriam fazer julgamentos rápidos sobre a característica perceptual de
49
novas sequências. Isso permitiu testar o conhecimento da estrutura gramatical, sem que
os participantes soubessem de sua existência.
Tillmann conclui que o conhecimento da gramática artificial é adquirido durante
o momento da exposição e que este conhecimento permitiria o desenvolvimento de
expectativas auditivas, diminuindo o tempo de processamento e influenciando o
julgamento de forma indireta (Tillmann, 2010).
Exemplos de excertos gramaticais Exemplos de composições agramaticais
Figura 12 - Extraído de Tilmann (2010)
Tillmann (2010) argumenta que o aprendizado estatístico é uma característica
fundamental para o sistema cognitivo, pois possibilita a incorporação de informações
altamente complexas que não poderiam ser adquiridas de forma explícita. Ele reitera
que o conhecimento implícito do sistema tonal permite que ouvintes sem treino
específico para a música percebam relações entre eventos musicais e desenvolvam
expectativas acerca do material musical.
Esse estudo evidencia que as expectativas referentes à música tonal são
desenvolvidas levando em conta as relações internas do material musical, que são
internalizadas e viabilizam a construção de representações mentais que contêm a
estrutura do material sonoro.
ara Vuust (2014), o “aprendizado estatístico dependente da cultura”7 surge de
acordo com padrões temporais e tonais do som que variam consoante regras e
convenções específicas de gêneros, estilos e culturas específicas, formando no ouvinte
uma gramática musical individual, particular.
7 Statistical learning cultural dependent
50
2.2. Entropia na Música
Assim como a linguagem, a música pode ser considerada um processo
estocástico, que possui inúmeras possibilidades de evolução, um processo
indeterminado, regido probabilisticamente, podendo desenvolver-se em infinitas
direções (Besson, 2001).
Processo estocástico [...] é [...] um processo no qual a
movimentação de um estado para o seguinte é determinada
por uma variável independente do estado inicial e final.
(Rochol, 2011)
Meyer (1967) assume que o significado no contexto musical é diretamente
relacionado a sua entropia, isto é, à incerteza da ocorrência de um determinado evento
musical. Segundo ele, essa incerteza no desenrolar musical engendra uma maior tensão
subjetiva, correlacionada a eventos musicais significativos.
O significado musical surge quando uma situação
antecedente que requer uma estimativa dos modos
prováveis de continuação de padrões produz incerteza em
relação à natureza temporal-tonal do consequente
esperado. (Meyer, 1967)
Um evento pouco provável contém um maior teor de informação, conforme a
Teoria da Informação (TI) criada em 1948 por Shannon, que objetivava resolver
problemas relacionados à comunicação por telégrafos (Shannon, 1948). A comunicação
é modelada a partir dos símbolos que possuem determinadas probabilidades de
ocorrência. Eles pertencem ao vocabulário da fonte abstrata, podendo esta ser uma
sequência numérica, uma língua ou - como é conveniente ao propósito deste trabalho:
uma música.
O cálculo da entropia da fonte leva em conta a probabilidade de ocorrência dos
símbolos, que é diretamente proporcional ao número de símbolos e à similaridade de
suas probabilidades. Quanto maior a equiprobabilidade (símbolos que ocorrem com a
mesma probabilidade), maior a incerteza. Quanto maior a incerteza, maior a entropia.
Meyer sublinha que as probabilidades de ocorrências são determinadas pelo
estilo musical. É evidente que as expectativas são construídas levando em conta as
relações internas do material musical. Meyer assinala os cuidados com o trato da
música de forma estatística. É preciso levar em conta os diferentes graus de hierarquia
51
dos estilos e do contexto em que os dados são avaliados, porque diferentes estereótipos
ocorrem em diferentes níveis de estruturação musical, conduzindo a diferentes
distribuições estatísticas. Em suma: o cálculo de probabilidades é altamente dependente
de contexto. Por exemplo, para Huron (2006) a música tonal é marcada por uma alta
probabilidade de que grandes saltos de intervalos sejam seguidos por pequenos saltos
em direção oposta (logo, há uma baixa probabilidade de que estes sejam seguidos de
saltos grandes na mesma direção). Uma série de outras regularidades tonais têm impacto
direto na distribuição de probabilidades e, por conseguinte, na entropia musical serão
comentadas no subcapítulo intitulado “Regularidades Tonais”.
Embora a maioria dos estudos teóricos sobre informação musical concentrem-se
em propriedades brutas de estilo ou em grandes segmentos musicais, recentemente,
técnicas de modelagem com redes neuronais artificiais tentaram compreender se é
possível correlacionar medidas instantâneas de entropia com respostas afetivas
momentâneas à música. Por exemplo, um autêntico ponto de cadência é um centro de
estabilidade e deve ser correlacionado a um menor grau de entropia. Um clímax
dramático deve ser correlacionado com um alto valor de entropia, pois representa uma
grande quantidade de tensão (Cox, 2010). Gregory Cox desenvolveu uma Rede
Neuronal Recorrente (RNN) com o intuito de investigar até que ponto a entropia pode
ser interpretada como medida de tensão e, por conseguinte, de significado musical. Ele
buscou comparar as medidas de entropia dos estímulos com as análises teóricas da
música tradicional. As análises endossaram a hipótese de que a tensão subjetiva ao
significado musical relaciona-se diretamente com o grau de entropia, isto é, de incerteza
do input.
a-) Entropia e Agradabilidade
Vuust (2014) analisou a relação entre agradabilidade musical e a complexidade
estatística medida a partir da entropia. O pesquisador vem desenvolvendo uma extensa
pesquisa sobre o modo com que os sons musicais tornam-se gratificantes através de
processos preditivos nas redes de prazer do cérebro, incluindo a liberação de dopamina
no mesencéfalo.
A relação encontrada deu-se em uma curva em forma de “U” invertido. Maiores
níveis de agradabilidade foram alcançados em músicas que apresentam níveis
intermediários de entropia. Os pesquisadores notaram que uma batida muito simples,
52
muito previsível, não tem apelo às pessoas, mas adicionando algumas aberrações e
irregularidades ao ritmo sua popularidade é aumentada. Em contrapartida, estímulos
muito aleatórios, desestruturados e sem traços característicos também perdem apelo.
“Quando o ritmo é muito complexo, perdemos o modelo que o constitui, há muita
irregularidade, perdemos a capacidade de fazer previsões e, consequentemente, a
capacidade de sermos recompensados, na incorrência de um erro de predição positivo”,
declara Vuust. Ou seja, um evento pode deixar de ser interessante de duas maneiras:
apresentando uma entropia muito baixa ou muito alta: muita informação pode não ser
bem vinda do ponto de vista musical.
Talvez esse argumento justifique a falta de popularidade do serialismo
dodecafônico, cuja entropia e níveis de informação encontram-se deliberadamente
acima do ideal (Abdallah & Plumbley, 2008). Não é possível estabelecer ligações, não
há experiência e nem formação de modelos estatísticos que permitam a interação e a
antecipação do continuum sonoro, dada a extensa quantidade de informação e entropia
do sistema.
b-) Agradabilidade e Exposição
Vuust (2017) alega que as audições aumentam a agradabilidade musical, pois
a música desconhecida oferece um quadro de previsibilidade muito fraco. Com a
crescente exposição, a música é contextualizada (por exemplo: determinando o tom, o
tempo, a duração, a forma, o gênero) levando a expectativas esquemáticas de maior
certeza. Simultaneamente, expectativas verídicas surgem causando conflitos potenciais
com expectativas esquemáticas (Huron, 2006). Isso atualiza o modelo preditivo do
ouvinte, gerando expectativas mais adequadas.
Com níveis crescentes de exposição (e, em última instância, sobreexposição),
a quantidade de erros de predição diminui gradualmente à medida que as expectativas
verídicas se tornam cada vez mais influenciadas pela entrada sensorial. O aumento da
certeza combinada com a ponderação do erro de predição (devido a uma certeza
preditiva gradualmente maior), com menos instâncias de erro de predição (devido à
tendência à minimização da energia livre) resulta em uma trajetória em forma de U
invertido na apreciação musical, com o aumento da exposição. Isso explica porque ao
escutar uma música demasiadas vezes ela acaba por abalar o seu apelo gratificante.
53
2.3. Abordagens Bayesianas e Codificação Preditiva
Uma das perguntas que mais intriga os cognitivistas é como pode o cérebro lidar
com processos incertos. Como é possível fazer predições sobre a padronização de inputs
sensoriais, dentre os quais a música é um exemplo (Clark, 2013)?
O fluxo de novas informações sobre o sistema nervoso transforma radicalmente
a maneira de interpretá-lo. O cérebro já foi visto como um espelho da realidade externa
e também como um intérprete. Atualmente, ele começa a ser visto como um preditor,
uma máquina de fazer inferências probabilísticas sobre o mundo. Em Kinds of Minds
(1996), Daniel Dennet argumenta que a mente é fundamentalmente um antecipador de
eventos, um gerador de expectativas, uma máquina de antecipação que é mimada com
recompensas sempre que faz previsões corretas. O cérebro elabora hipóteses sobre os
possíveis inputs e compara com os dados sensoriais. As hipóteses favorecidas são
aquelas que minimizam as incertezas e diminuem os erros de previsão entre as apostas e
a experiência.
É frequentemente assumido que o mecanismo subjacente à aprendizagem
estatística do cérebro seja regido por modelos probabilísticos internos que se
Figura 13 – Proposta de entendimento da relação exposição x
agradabilidade musical de Vuust (2017).
54
aproximam das estatísticas bayesianas. Estes modelos levam em consideração as
tendências ou as distribuições prévias de probabilidade que contribuem para o
aprendizado. As abordagens bayesianas das funções cerebrais tentam dar conta da
capacidade neuronal de operar de forma ótima em situações de incerteza. Atualmente,
um largo espectro de estudos interpretam os resultados de experimentos psicofísicos à
luz de modelos bayesianos e questionam como o cérebro pode implementar estes
algoritmos bayesianos (Friston 2002; Shepard, 2001; Tononi, 1998).
Estatística bayesiana é um ramo da Estatística que usa a
probabilidade P como medida condicional de incerteza
associada à ocorrência de um evento E, dada a informação
disponível D. Logo, P(E|D) é uma medida de crença de
ocorrência de um evento E quando ocorrem as condições
resumidas nos dados D. (Paulino et al, 2003)
Um modelo promissor foi proposto por Friston (2005), em que a Codificação
Preditiva é o princípio central da função cerebral. Friston fornece uma descrição de
como o cérebro identifica e categoriza as causas de seus inputs sensoriais, posto que
humanos e animais vivem em um mundo de incertezas. O modelo tenta demonstrar
como os neurônios podem reconhecer padrões sensoriais por inferência bayesiana,
combinando-os com o conhecimento prévio para inferir causas de alto nível aos
estímulos.
A Codificação Preditiva postula uma organização hierárquica, através da qual as
regiões cerebrais de baixo-nível estimam as previsões de estímulos esperados, baseado
em informações contextuais através de conexões de feedback de regiões mais altas
(Friston, 2002). Um evento inesperado contradiz a expectativa, gerando uma
comparação entre previsão e input recebido, e um termo de erro que, se for
suficientemente significativo, forçará uma atualização da expectativa. A memória de
curto prazo também será resetada, abandonando as expectativas anteriores e será
iniciada uma resposta orientada ao novo contexto, permitindo a aquisição de novas
associações explicativas (Gossberg, 1982). Isso gera um processo recursivo que visa
minimizar o erro de predição, ou seja, diminuir a diferença entre input e previsão. É
defendido que o cálculo cerebral que calibra a medida das incertezas e expectativas
opera de acordo com o Teorema de Bayes, expresso forma da seguinte equação:
55
Onde:
H – hipótese afetada pelos dados
E – evidências, dados que não foram utilizados no cálculo de probabilidade
anterior.
P(H)- probabilidade a priori, probabilidade da hipótese antes da análise das
evidências.
P(H|E) - probabilidade a posteriori, isto é, a probabilidade da hipótese após a
análise das evidências.
P(E|H) – probabilidade de se observar as evidências dada a hipótese. Trata-se da
compatibilidade entre as duas.
P(E) – probabilidade marginal, uma constante para todas as hipóteses possíveis.
No modelo bayesiano para expectativas, a inferência probabilística de qualquer
fenômeno é dinâmica e completamente sensível ao contexto. O contexto é fundamental
para entender o processo de detecção de padrões envolvido na aprendizagem implícita
e, portanto, na compreensão dos mecanismos subjacentes à aquisição de regras. A
hipótese bayesiana aquiesce com o que Otto Laske já havia postulado em 1977 acerca
da apreciação do continuum sonoro: “um processo de resolução de quebra-cabeças ou
caminhar por um labirinto, onde o estado atual de processamento musical deve ser
inferido através da somatória de todos os estados de inferência anteriores”. Observamos,
assim, a existência de uma pragmática formal da percepção musical, que funciona por
meio das inferências.
Como vem sendo repetido: a geração e subsequente confirmação ou violação de
expectativas é crítica para a experiência estética e para o significado musical (Meyer,
1956; Wiggins, 2006). Quando se escuta uma peça de música, o envolvimento dinâmico
com o modelo estatístico do ouvinte o habilita a fazer as predições sobre o desenrolar,
lançando mão dos conhecimentos e templates aprendidos em experiências prévias, mas
também de acordo com o contexto imediato da peça em desenvolvimento. As
expectativas musicais são moldadas pela apreensão estatística da ocorrência de eventos
sonoros. Ao passo que a música desenrola-se, há uma revisão do modelo e -
consequentemente - do estado de crença probabilística que sustenta as futuras predições.
56
A frustração de uma expectativa musical é consequência de um evento de baixa
probabilidade acontecer no lugar de um evento provável. Segundo Levitin (2016): “a
música é o som organizado, mas sua organização também envolve o elemento
inesperado, de outro modo seria emocionalmente fraca ou automatizada” (tradução
livre). As predições temporais e qualitativas acerca de notas futuras podem ser
surpreendidas, por exemplo, por uma nota antecipada ou atrasada em relação ao tempo
predito ou mesmo uma nota alterada, o que suscita um erro de predição.
a-) Erros de Predição
Teorias recentes do processamento da recompensa postulam que a resposta
dopaminérgica reflete os erros de predição. Como já foi dito: a manutenção de um
quadro de informações do meio em que o organismo está inserido possibilita uma
melhor leitura do ambiente e com poucos custos energéticos. Tal análise e atualização
de dados do ambiente permite a inferência probabilística de invariações, bem como a
predição de eventos futuros.
Schultz (2010) defende que o termo de erro, isto é, a discrepância entre o evento
ocorrido e o previsto seja codificada pelos neurônios dopaminérgicos, que são
fundamentais para o condicionamento Pavloviano8. Os neurônios dopaminérgicos do
mesencéfalo respondem quando a recompensa é ainda maior do que a prevista, guiando
o aprendizado (Schultz, 2016). Os erros de previsão de recompensa ajustam as forças
sinápticas até que o ambiente possa ser previsto com acuidade. O disparo
dopaminérgico reforça o comportamento para a aprendizagem sobre recompensas e para
a motivação em busca de mais recompensas - um traço evolutivo - uma vez que a
dopamina é reconhecida por reforçar as conexões sinápticas que motivam a realização
de determinado comportamento. Ações gratificantes são aquelas que minimizam a
energia livre do cérebro, criando assim um modelo mais forte e preciso do mundo.
A maioria dos neurônios da dopamina no mesencéfalo de humanos, macacos e
roedores é ativada quando há mais recompensa do que o previsto (erro de previsão
8 Condicionamento Pavloviano: É um tipo de aprendizagem descoberta pelo fisiologista Ivan Pavlov
(1849-1936) que ocorre por associações entre um estímulo ambiental (estímulo neutro) e um estímulo que
ocorre naturalmente (estímulo incondicionado). O Condicionamento Pavloviano envolve a colocação de
um sinal neutro antes de um reflexo que ocorre naturalmente. No experimento clássico de Pavlov com
cães, o sinal neutro era o soar de um sino e o reflexo que ocorrria naturalmente era o salivar em resposta
aos alimentos. Ao emparelhar sucessivas vezes o estímulo neutro com o estímulo ambiental, o som do
sino por si só poderia produzir a resposta de salivação nos cães.
57
positivo). Os neurônios dopaminérgicos permanecem em atividade na linha de base
quando as recompensas são totalmente previstas e mostram atividade deprimida com
recompensas menores do que a prevista (erro de previsão negativo) (Schultz, 2011
Asaad, W. F., & Eskandar, 2011).
Em seguida, veremos os resultados de experimentos feitos por Schultz com ratos
a respeito do tema:
Figura 14 - Schultz (1997) - Ativação dos neurônios
dopaminérgicos e sua relação com erros de predição
No estudo de Schultz (1997), na ausência de estímulo condicionado a resposta
dopaminérgica ocorre logo após a recompensa. Entretanto, havendo um estímulo
condicionado e não havendo recompensa, em função de um erro comportamental,
ocorre uma depressão dopaminérgica que sucede o momento predito da recompensa,
visando inibir o comportamento. No caso da recompensa predita ser igual à recompensa
ocorrida, a resposta dopaminérgica é zero. Se a recompensa predita foi menor do que a
Ao lado, vê-se o disparo
dopaminérgico no mesencéfalo de
macacos. No primeiro gráfico,
notamos o disparo dopaminérgico
quando recebem um suco adocicado,
sem previsão desta recompensa, isto
é, um erro positivo de predição de
recompensa.
Após o aprendizado, o estímulo
condicionado prediz a recompensa e
esta ocorre de acordo com a previsão.
Não há erro na previsão. O neurônio
dopaminérgico não é ativado pela
previsão.
No último caso, o estímulo prediz a
recompensa, mas esta não acontece
por um erro comportamental. A
atividade do neurônio dopaminérgico
é deprimida exatamente no momento
em que a recompensa deveria
acontecer.
58
recompensa ocorrida, a resposta dopaminérgica tem valor positivo, o que é reconhecido
como um Erro de Predição Positivo9 (Schultz, 1997, 2002; Fiorillo, 2003).
Esse comportamento pode ser melhor compreendido de acordo com a seguinte
equação:
Em 1972, Rescorla lançaria um dos primeiros modelos matemáticos para erros de
predição de recompensa, defendendo que a codificação do erro se dá em função da
diferença entre o peso do estímulo e a média dos estímulos passados, conforme a
equação a seguir:
ΔV= αβ(λ-V)
Em que:
V= força de associação entre estímulo e recompensa;
α = constante relativa à relevância do estímulo condicionado;
β = constante relativa à relevância do estímulo não-condicionado;
λ = força máxima de associação.
Quando a força de associação entre estímulo e recompensa é igual à força
máxima de associação, V= λ, o aprendizado é cessado (ΔV= 0).
Esse paradigma pode explicar a razão pela qual gostamos de músicas
ligeiramente mais complexas do que nosso esquema mental, ou nossa gramática musical
subjetiva. Por serem músicas menos previsíveis, com um grau médio de entropia
(Vuust, 2014), possibilitam a emergência de erros de predição positivos.
Por fim, dada a natureza antecipatória da música (e suas respectivas violações em
diferentes aspectos), ela mostra-se como um bom substrato para testar a hipótese de
Friston para a Codificação Preditiva (Vuust, 2017).
9 Positive Prediction Error
Ativação dopaminérgica = Atualização da Recompensa – Previsão da Recompensa
59
b-) Tipos de Erros de Predição Musical
Vuust (2014) faz uma sutil e importante distinção entre dois tipos de "erros de
predição" envolvidos na escuta musical:
i) Recompensa por erro de predição (RPE): referente a expectativas
psicológicas de como uma peça emocionalmente gratificante se
desenvolverá.
ii) Erro de predição (PE): relativo à computação neuronal de entrada sensorial
relacionada às previsões do cérebro sobre a própria música.
Essas diferenças podem ser traduzidas nas questões: "quanto eu vou gostar do
próximo acorde?" (RPE) e "qual é o próximo acorde?" (PE). O autor argumenta que
são apostas distintas e potencialmente ortogonais, com diferentes constituintes
neuronais (Vuust, 2017). Do ponto de vista computacional, o primeiro baseia-se no
aprendizado de reforço, que estabelece princípios computacionais para maximizar o
valor da recompensa, independentemente de especificidades músico-estruturais
(Schultz, 2013). O último aborda as previsões sobre a estrutura musical e foi modelado
utilizando o aprendizado estatístico e a codificação preditiva (Vuust et al., 2009; Hansen
e Pearce, 2014; Vuust e Witek, 2014; Hansen et al., 2016).
Na codificação preditiva, PE, o erro de predição não é nem positivo nem
negativo per se, mas forte ou fraco em um único contínuo (Vuust, 2017).
Uma reivindicação de Salimpoor et al. (2015) já vista anteriormente neste
trabalho, é que quando estamos ouvindo músicas nunca ouvidas antes, modelos
auditivos de som semelhantes são ativados para gerar expectativas de como os novos
sons serão desenvolvidos. Se os novos sons forem melhores do que o esperado (ou seja,
RPE), o PE positivo resultaria. Avaliar se a música é estruturalmente melhor do que a
sequência esperada requer, entretanto, uma mais definição clara e observamos
dificuldades em encontrar estudos que discutam a qualidade ou a valência emocional do
que seria um som melhor, de acordo com a gramática subjetiva dos ouvintes.
60
2.4. Psicologia das Expectativas
O papel da expectativa musical é largamente reconhecido nos dias atuais como
responsável por formar o comportamento afetivo relacionado a respostas fisiológicas e
psicológicas (Salimpoor, 2013; Zatorre, 2015; Vuust, s/d). A surpresa, o riso, o frisson,
a tensão ou o relaxamento causados pela música têm suas raízes nas expectativas
(Huron, 2006). As expectativas implicam uma série de representações mentais que
podem possuir diversas origens: o background cultural, o gênero musical em questão, os
esquemas musicais subjetivos, dentre outras. As representações são constantemente
examinadas e atualizadas através da experiência quotidiana.
A previsão de um evento permite uma preparação correta para a reação
apropriada e aumenta a chance de obter sucesso em tarefas que garantem a
sobrevivência e perpetuação da espécie. Durante o percurso da linhagem humana, foram
adquiridas respostas estereotipadas a vários tipos de estímulos. Por exemplo, ao ouvir
um evento inesperado (como um estrondo), desencadeia-se uma série de respostas
nervosas que tem como resultados comportamentais a resposta motora. Isso aumenta,
por exemplo, a chance de escapar aos predadores se o ataque for antecipado pela
audição (Levitin, 2010).
Em Sweet Antecipation: Music and the Psychology of Expectation, David Huron
(2006) postula a possibilidade de o prazer musical ser oriundo da capacidade preditiva
que gera expectativas. A gratificação sentida durante a escuta musical seria fruto da
adaptação biológica de estruturas fisiológicas especializadas em fazer predições. Se um
ouvinte pode predizer o desenvolvimento de uma música, ele gera as condições para
desenvolver um afeto por ela.
David Huron defende a existência de cinco componentes que ligam expectativas
músicais às recompensas, conhecidas pelo acrônimo ITPRA. Estas incluem respostas
de Imaginação, Tensão, Previsão, Reação e Avaliação.
61
Figura 15 - Esquema sobre as expectativas, proposto por Huron (2006).
As respostas da imaginação referem-se a situações em que completamos a
música em nossa mente (antes de sua conclusão real) e motivam o organismo a
incrementar a probabilidade de resultados futuros positivos. As respostas de tensão
referem-se à preparação pré-resultado (motora e perceptiva) que ocorre em antecipação
ao próximo passo ou resolução da música. Elas preparam o organismo, adequando
atenção e excitação para os níveis de incerteza e importância do evento. As respostas de
previsão provêem reforços positivos e negativos que incentivem expectativas. São
resultados de uma comparação entre a previsão e o resultado real da música: quando a
música é predita com precisão, ela é experimentada como gratificante. As respostas de
reação refletem uma resposta rápida ao resultado real, seja positivo ou negativo.
Finalmente, as respostas de avaliação refletem a determinação consciente do significado
do resultado.
É sugerido que a dopamina seja responsável pela alteração da força sináptica em
circuitos que envolvem os mecanismos de predição, elemento fundamental na
modelagem estatística das respostas. A reação e a avaliação são processos intimamente
relacionados (Huron, 2006). Conforme Huron (2006), o erro de predição, mesmo que
positivo, desencadearia reações e avaliações de forma muito ágil, forçando o organismo
a oferecer respostas estereotipicamente rápidas a falhas nas expectativas, posto que tais
erros preditivos colocam um organismo preditor em risco. Respostas automáticas são de
extrema utilidade na sobrevivência das espécies, ainda que muitas vezes estas respostas
sejam imprecisas.
Para Huron (Ibidem), a reação rápida e automatizada ao erro de predição
fundamenta a experiência estética com a música. Quando as apostas sobre o desenrolar
62
da peça são frustradas por diferentes acontecimentos, elas evocam respostas fisiológicas
semelhantes às do medo. Uma abordagem que o autor chama de Biologia do
Pessimismo.
2.5. Biologia do Pessimismo
Quando o cérebro falha ao prever um evento, esse erro é rapidamente
interpretado por uma via rápida que oferece respostas fisiológicas automatizadas. Em
seguida, essas respostas são reavaliadas por uma via lenta, que processa o
acontecimento no córtex, bloqueando as reações iniciais, sendo elas absolutamente
primitivas: a fuga, a luta ou o congelamento. Esse tipo de resposta preventiva mostra-se
muitas vezes inadequada, porém, é preferível responder erroneamente a um risco
eventual do que não responder. Uma abordagem acurada leva tempo e o tempo muitas
vezes é um fator crucial para a sobrevivência e proteção de um organismo. Uma análise
mais precisa é feita, entretanto, pelos mecanismos de avaliação que podem modular ou
bloquear a reação prévia. A razão para essas características específicas seria a existência
de duas vias anatômicas específicas de avaliação das respostas, conforme o diagrama
abaixo:
Figura 16 - Diagrama para as vias rápidas e lentas de resposta ao medo (traduzido de Huron, 2006).
Estas respostas ao medo (por exemplo, quando escutamos um estrondo na
rua ou um barulho que não se encaixa no contexto em que nos encontramos) são,
segundo David Huron, elementos cruciais ao prazer musical. Uma mudança repentina
no desenrolar de uma peça, um erro de predição positivo, que surpreende e entra em
conflito com nossos templates armazenados, desencadearia respostas fisiológicas
63
específicas ao medo, evocando, por um curto período de tempo, a resposta da via rápida,
desencadeando respostas como o frisson, o riso ou a reverência.
São evolutivamente muito antigos estes mecanismos de resposta ao medo,
possivelmente anteriores à formação da consciência, mas que, possivelmente, devido à
eficácia de suas ações ainda são mantidos (Huron, 2006).
A ação paralela das duas vias seria responsável pelas reações
comportamentais da surpresa. Ao ouvir um estrondo, uma série de reações fisiológicas e
comportamentais são desencadeadas, como o aumento do batimento cardíaco, da
sudorese, o aumento do fluxo sanguíneo. Estas respostas são ativadas pela via rápida,
que responde cerca de 150 ms após o evento. Se o estímulo demonstrar não ser perigoso
ou ameaçador, como é o caso do estímulo musical, o processo de avaliação pondera a
reação através da via lenta, usando o hipocampo e dos córtices sensoriais, o que faz com
que a resposta seja mais precisa.
Dennis Dutton (2005) vem aquiescer com Huron no que diz respeito ao uso de
estruturas muito basais pela a apreciação estética:
“É claro que após o surgimento de uma cultura - que do
ponto de vista biológico pode ser vista, dentro de certos
limites, como uma forma de biologia - é razoável supor
que novas funções viessem a compartilhar os mesmos
mecanismos anteriormente utilizados para funções basais
de sobrevivência e conservação das espécies, embora
extremamente complexas, como comunicação e música”
(Dutton, 2005).
Os padrões de expectativa e surpresa na música são articulados numa rede
complexa de relações entre a informação prévia e as condições em que a escuta musical
se realiza. Da formulação de uma expectativa e sua violação, nasce a surpresa. Sem
expectativa, não pode haver surpresa. A surpresa ocorre, conforme Huron, quando os
dois esquemas de predição e expectativas (bottom-up e top-down) entram em conflito,
apostando em diferentes resultados para um mesmo fenômeno.
“ orque o cérebro nunca abaixa sua guarda, os músicos podem
confiar nos sons para evocar praticamente a mesma resposta
cada vez que a música é ouvida. Se a via rápida não fosse tão
teimosa em sua interpretação pessimista da surpresa, as obras
musicais familiares perderiam rapidamente seu poder para as
64
emoções de evocar frisson, risos e admiração. Claro, a audição
muda com a exposição. Mas a via rápida responde
principalmente com base em expectativas esquemáticas, e as
mudanças de esquema acontecem apenas com exposição
extensa.” (Huron, 2006, página 36).
A iminência do risco causa nos organismos três reações clássicas: a luta, a fuga
ou o congelamento. Quando bloqueadas pela via lenta, essas reações transformam-se em
surpresa. Huron postula, de forma especulativa, que seriam as discrepâncias entre as
vias que dariam origem ao prazer musical.
Huron, curiosamente, relaciona as respostas de luta, fuga e congelamento ao
frisson, ao riso e à reverência, respectivamente.
i) Luta e Frisson – As respostas de luta são agressivas e colocam em uma
postura de enfrentamento. Têm como característica o eriçamento do pêlo,
comum em estados de frisson durante a fruição musical. Indícios suportam a
ideia de que arrepios e calafrios ocorrem em função de violações de
expectativas (Sloboda, 1991), mais especificamente as violações de métrica,
na dinâmica e na harmonia (Huron, 2006).
ii) Fuga e Riso – A resposta de fuga é caracterizada pelo aumento da excitação,
bem como alterações respiratórias, partilhada pelo riso.
iii) Congelamento e Reverência – O congelamento é caracterizado pela
imobilização motora, retenção da respiração, partilhados nos estados de
reverência.
65
3. Intersecção entre Música e Linguagem
Muitas são as linhas de pesquisa que apontam para o compartilhamento de
mecanismos entre música e linguagem. É declarado que ambas valem-se da
manipulação dos diferentes parâmetros do som para sua organização, além de
compartilharem a necessidade de uma organização hierárquica, isto é, sintática que
implica em compreensão semântica (Patel, 2008). Deutsch (2010) descreveu algumas
similitudes entre os aspectos estruturais da linguagem e da música tonal.
"Ambas são governadas por uma gramática, em que os
elementos básicos são organizados hierarquicamente em
seqüências de acordo com as regras estabelecidas. No idioma, as
palavras se combinam para formar frases, que se juntam para
formar frases maiores, que, por sua vez, se combinam para fazer
sentenças. Da mesma forma, na música, as se combinam para
formar frases, que se conectam para formar frases maiores e
assim por diante. Assim, para entender o idioma e a música, os
ouvintes devem inferir a estrutura das passagens que ouvem,
usando regras que eles assimilaram através da experiência”.
(tradução livre 10
- Deutsch, 2010)
atel (2008) define sintaxe como “um conjunto de princípios que governam a
combinação de elementos estruturais discretos em sequência, como as palavras ou as
notas musicais”. Se a música tonal é estruturada a partir da noção de tonalidade, ela
apresenta uma hierarquia entre os tons, sendo a tônica notada como som principal do
sistema, ou da escala, uma espécie de refúgio para onde a dinâmica tonal, ou conjunto
das cadências harmônicas, tende sempre a retornar. De modo não-consciente, uma
descrição estrutural é atribuída aos estímulos acústicos (melodias, harmonias, cadências,
padrões rítmicos).
Embora várias linhas de pesquisa apontem para estes pontos em comum, música
e linguagem diferem em muitos aspectos. Uma grande variação de timbres é utilizada na
fala em um curto espaço de tempo, formando-se vogais e consoantes. Na música, há
maior variação de alturas e a duração de cada som é maior do que na fala. (Patel, 2008)
10
“They are both governed by a grammar, in which basic elements are organized hierarchically into sequences according to established rules. In language, words combine to form phrases, which join to form
larger phrases, which in turn combine to make sentences. Similarly, in music, notres combine to form
phrases, which connect to form larger phrases and so on. Thus, to understand either language and music,
listeners must infer the structure of the passages that they hear, using rules they have assimilated through
experience.” (Deutsch, 2010)
66
Na música, as variações de duração desempenham papel mais importante do que na
fala, tendo que ser realizadas de maneira precisa.
Além disso, a componente sintática é apenas parcialmente compartilhada entre
música e linguagem. As diferenças entre "sintaxe de linguagem" e "sintaxe músical"
podem ser encontradas em vários níveis, tanto do significado transmitido, quanto dos
átomos de combinação, por exemplo.
3.1. Hipótese do Compartilhamento dos Recursos Sintáticos
Integrados
Patel (2008) sugere que o processamento musical e o processamento sintático
linguístico compartilham a mesma área cerebral, apesar de representacionalmente
possuírem módulos distintos. Para tal, ele correlacionou estudos de amusia e a afasia,
encontrando indícios de uma justaposição das estruturas de processamento sintático da
língua e do processamento sintático musical.
Figura 17 - Diagrama de como música e linguagem se correlacionam, segundo a hipótese do recurso de integração
sintática compartilhada (PATEL, 2008).
a-) Detecção de Incongruências
A ativação simultânea de um determinado grupo de neurônios estabelece o
surgimento de pequenas correntes elétricas iônicas. Essas pequenas correntes permitem
o monitoramento o funcionamento desses agrupamentos, pela leitura dinâmica dos
influxos e efluxos iônicos, captadas por eletrodos posicionados na superfície do escalpo.
Esta técnica é denominada EEG – eletroencefalograma.
67
Nos anos 80, os estudos neurolinguísticos foram revolucionados com a
utilização de uma técnica de extração de ERP11
– Potencial Relacionado a Evento, um
método não invasivo de aquisição de sinais eletrofisiológicos obtidos em resposta a
determinados estímulos, por meio do eletroencefalograma. Um tema muito estudado
(Kuttas & Hillyard, 1980) foi o impacto de um de argumento interno incongruente em
relação à seleção semântica do verbo. Vê-se no exemplo:
a-) Maria cortou o bolo.
b-) Maria cortou o pé.
c-) Maria cortou a lua.
Os objetos diretos (a) e (b), bolo e pé, são complementos congruentes ao verbo
cortar, visto que ambos, apesar de seus diferentes significados pertencem à classe de
coisas que podem sofrer a ação do verbo: ser cortado. Diferentemente, o argumento (c)
é incongruente porque não pertence à classe de coisas que podem passar por esta
alteração de estado.
A incongruência semântica foi relacionada a um potencial elétrico negativo de
amplitude elevada e com uma latência de 400 ms após o trigger (palavra-alvo),
conhecido como N400. Verificou-se que a amplitude do pulso varia numa função
inversa à expectativa da palavra esperada para a finalização de sentenças.
Influenciados pelo experimento supracitado, Besson & Faïta (1995) realizaram
um estudo que buscava compreender se incongruências melódicas ou harmônicas, no
contexto tonal, poderiam elicitar um componente N400 – reconhecidamente sensível a
incongruências semânticas na linguagem. Foi realizado um experimento de escuta
passiva entre músicos e não-músicos, que tinham como estímulo fragmentos musicais
familiares e não familiares. A última nota dos fragmentos era manipulada gerando finais
congruentes, diatônicos e não-diatônicos, visando produzir diferentes graus de
incongruência. Vê-se abaixo alguns exemplos utilizados:
11
Event-related potenctials
68
Figura 18 - Diferentes finalizações para os fragmentos usados por Besson & Faïta (1995).
No estudo de Besson & Faïta (1995), diferentemente dos casos de
incongruência semântica na linguagem, as incongruências sintáticas na música tonal
provocaram uma componente positiva P600 que também tem sua amplitude modulada
em função inversa da congruência. No contexto da linguagem, este é um potencial
reconhecidamente relevante na audição ou leitura de erros gramaticais e outras
anomalias sintáticas.
A importância deste experimento reside na evidência empírica da existência de
uma estrutura subjacente que conduz a percepção de frases musicais (Besson & Faïta,
1995), ainda que os autores tenham detectado limitações em seu estudo. É de acordo
com esse pressuposto que vamos introduzir o conceito de Teoria Gerativa da Música
Tonal na seção a seguir.
3.2. Teoria Gerativa da Música Tonal - GTTM
Dentre as inúmeras propostas de analogias mais ou menos diretas entre regras
linguagem e as regras de um sistema musical (Winograd, 1968; Bernstein, 1976) o
tratamento sintático da música foi descrito de modo mais completo e bem-sucedido em
1983 pelos pesquisadores Jackendoff & Lerdahl em Generative Theory of Tonal Music,
ou Teoria Gerativa da Música Tonal (GTTM doravante).
Influenciados pela teoria linguística descritiva de Noam Chomsky para as
línguas naturais (que argumenta a respeito de uma gramática universal subjacente a
69
todas as línguas humanas), Jackendoff & Lerdahl defendem que a música tem uma
estrutura hierárquica análoga às construções linguísticas, com uma sintaxe associada.
Eles apresentam uma descrição da intuição musical de um ouvinte experiente (qualquer
ouvinte com uma certa bagagem de conhecimento implícito que o permita gostar de
música) através de um sistema de regras e princípios, que seriam capazes de gerar todas
as melodias do idioma musical tonal e descartar sequências sonoras que não pertençam
ao idioma, de modo análogo à agramaticalidade de Chomsky.
Para a Teoria Gerativa da Música Tonal, as regras transformacionais que servem
a Linguística permitem intercambiar as próprias funções comunicativas da música e da
linguagem. Lerdahl & Jackendoff, de modo análogo a Chomsky, buscam uma gramática
universal musical geradora de melodias. Eles associam numa mesma aplicação uma
explicação cognitiva e um paradigma composicional da música.
A base comum entre os modelos acaba por evidenciar semelhanças e distinções
entre os processamentos linguístico e musical. A hipótese é de que os mecanismos
utilizados para o processamento linguístico são parcialmente compartilhados no
processamento musical aquiescendo com a hipótese de Patel (2008). Segundo Lerdahl
& Jackendoff (Ibidem) há quatro componentes na gramática tonal, relacionadas
hierarquicamente:
Estrutura de agrupamento: os sons são agrupados em grandes cadeias.
Estrutura métrica: os pulsações da peça são hierarquizados em fracos e fortes.
Redução temporal: A estrutura rítmica é simplificada de forma consecutiva,
desvendando as estruturas mais relevantes de um agrupamento.
Redução prolongacional: A dinâmica de tensões e relaxamentos dos acordes é
percebida, conduzindo assim a direção do movimento tonal.
Por serem hierárquicos, possuem níveis de organização próprios, mas raramente
existem isoladamente na música, posto que há interação entre os diversos componentes
musicais. Além dessas componentes, os autores apresentam dois conjuntos de regras
que estabelecem critérios de coerência para as estruturas.
As leis específicas que regem cada uma das componentes musicais descritas pela
GTTM chamam-se Regras de Boa Formatividade. Entretanto, as Regras de Boa
Formatividade, por serem puramente formais, podem corresponder ou não às intuições
70
musicais efetivas. A percepção musical, assim como a visual, não agrupa eventos de
qualquer modo possível, mas em modos específicos motivados pelo todo das partes.
São as Regras Preferenciais que permitem às Regras de Boa Formatividade
serem burladas, fazendo da música um sistema de regras violáveis.
Assim, a escolha do melhor elemento dentro de um conjunto de alternativas
possíveis pode ser interpretado de acordo com Teoria da Otimalidade (Prince &
Smolensky, n.d.) uma teoria geral sobre como as gramáticas são estruturadas, que
examina as restrições de boa formação linguística, operando com restrições universais,
sendo elas: a violabilidade, a hierarquia, a relevância, a inclusividade e o paralelismo
em busca da seleção do elemento ótimo. A gramática de cada idioma musical é
determinada por diferentes hierarquias de restrições universais, uma vez que estas
restrições podem ser re-ranqueadas.
“A violação de uma restrição não é considerada uma causa
direta da agramaticalidade, assim como a satisfação
absoluta de todas as restrições não é um requisito essencial
para que os outputs sejam considerados ótimos em
determinada circunstância.” (Prince, A., & Smolensky, P.
n.d.).
Seriam, portanto, as escolhas ótimas na composição musical que viabilizariam o
prazer, ao aumentarem a entropia do sistema (as incertezas sobre o desenrolar) burlando
as expectativas tonais do ouvinte, uma vez que o melhor output de uma gramática é a
violação menos custosa do conjunto de restrições hierarquicamente organizadas por
aquela gramática em particular (Smolensky, n/d).
3.3. Modelos de Expectativas para a Melodia
No largo debate acerca dos sistemas cognitivos que envolvem a geração de
expectativas musicais, duas posições entram em disputa: a primeira consiste na
existência de um esquema com número limitado de regras simbólicas, que se pensa
serem inatas (bottom-up) e consistem em princípios da Psicologia Gestalt. A segunda
aborda as influências top-down de conhecimento estilístico adquirido por extensa
71
exposição a estímulos musicais de um determinado gênero que surgem do acesso à
memória episódica (Huron, 2006).
Para exemplificar, um processo top-down começa com o conceito, que se
detalha. Por exemplo, se eu sei que o próximo objeto que vou ver é um carro, a
expectativa vai me guiar para processar os detalhes deste carro. Já os processos bottom-
up começam pelos detalhes: eu vejo alguns elementos, vejo as rodas, os vidros, a
carroceria, então eu percebo que se trata de um carro. Essa analogia serve para nos
conduzir pelos modelos de expectativas melódicas detalhadas a seguir:
a-) Modelo de Narmour - Narmour (1992) introduziu uma teoria da melodia que
distingue dois tipos de situações melódicas. As implicativas, que evocam um forte
sentido de previsibilidade, e as não-implicativas. A teoria busca descrever que tipo de
expectativas os ouvintes desenvolvem em contextos altamente implicativos. Ele propõe
que estas são resultados de processos bottom-up e top-down. Os processos bottom-up
são independentes de um conhecimento a priori e incluem princípios que relacionam o
tamanho e a direção dos processos melódicos. Os processos top-down incorporam a
experiência prévia do ouvinte, bem como a história particular do desenvolvimento da
peça que é ouvida. O modelo de Narmour, juntamente com o modelo de Krumhanls
denominado “Teoria da hierarquia Tonal” protagonizam a base de um grande número de
pesquisas em expectativas melódicas. Esse modelo foi também estendido por Lerdahl
em Tonal Pitch Space Theory (2001), que estabelece fatores de estabilidade e
mobilidade (Aarden, 2003).
b-) Modelo de Margulis – Margulis (2005) modelou uma dinâmica de
expectativas adaptativas baseado em várias fontes de informação de alturas do som. Ele
considera quatro parâmetros principais: a estabilidade, a proximidade, a direção e a
mobilidade, bem como implementa hierarquias entre as classes. Antes das
considerações hierárquicas, os quatro parâmetros são definidos quantitativamente em
tabelas numéricas. Por exemplo: o valor de estabilidade é tomado de uma tabela que
define a força num contexto tonal. A proximidade captura a intuição dos ouvintes na
expectativa de eventos seguintes. A direção é um resultado da descrição de intervalos
melódicos. A mobilidade resulta de repetição. Para todos os parâmetros, “a
quantificação é coletada pela interpretação de resultados de experimentos pré-existentes
72
e pela consulta da intuição na tentativa de traçar a sensação de tensão das expectativas
originais” (Margulis, 2005).
O modelo de Margulis descreve três tipos distintos de reações para os ouvintes,
cada tipo derivado da tensão ouvida. Tensão-Surpresa: inversamente proporcional ao
grau de expectativa, que resulta em intensidade ou dinamismo. Tensão de negação:
proporcional à discrepância entre a expectativa do evento mais esperado e a expectativa
do fato realmente percebido. Resulta em desejo, impulso, vontade. Expectativa-
Tensão: proporcional ao grau de expectativa do evento mais esperado (em outras
palavras, se o ouvinte não tivesse idéia do que esperar, a tensão de expectativa seria
baixa). Resulta em tensão ou anseio.
c-) Modelo Generalista de Huron - Para Huron (2006), as regularidades
estatísticas ocorrem em diferentes dimensões da música tonal (melodia, harmonia,
ritmo, estrutura métrica). Ele defende que as regras perceptuais que são utilizadas para
estabelecer a tonalidade, isto é, quais notas esperar, são formadas por simples exposição
estatística. Sua aquisição se daria ainda no útero da mãe, contudo, seriam masterizadas
entre os cinco e sete anos de idade (Wiggins, 2006). Wiggins detectou a percepção de
mudança de tom em músicas familiares em crianças
3.4. Regularidades Tonais
As regularidades estatísticas do sistema tonal foram sumariamente destacadas por
David Huron. Uma síntese dessas regularidades pode ser conferida a seguir:
i. Proximidade de Altura- Há uma forte tendência ao uso de intervalos pequenos de
altura em melodias.
ii. Passo Descendente- Vos and Troost (1989) investigaram a regularidade melódica
dos padrões da música ocidental. Os resultados mostram que intervalos pequenos
tendem a ser descendentes e, como consequência, intervalos considerados grandes
tendem a ser ascendentes.
iii. Passo Inercial – O termo "step inertia", cunhado por Paul Von Hippel (2000),
73
refere-se à propriedade de organização melódica em intervalos pequenos (1 ou 2
semitons) que tende a ser seguida de alturas que seguem a mesma direção melódica
(seja ascendente ou descendente). Todavia, num estudo estatístico, Hippel
examinou amostras de melodias de um largo espectro de culturas. Ele observou que
apenas os intervalos descendentes tendem a manter a direção melódica.
iv. Regressão Melódica - Os teóricos têm observado que desde o século XVI há
uma tendência a intervalos grandes serem seguidos por uma mudança de direção
melódica. Em 1924, Henry Watt analisou amostras de peças de Schubert e Ojibway,
para confirmar tal hipótese. Os resultados demonstram que a proporção de intervalos
com mudança da direção melódica tende a ser proporcional ao tamanho do intervalo.
4. Música e Conexionismo
“Nenhuma regra precisou ser codificada para que esses
padrões emergissem, eles simplesmente refletem as
distribuições internalizadas de probabilidade através
da exposição prolongada a seqüências individuais”
(Bharucha, 1979).
Nas Ciências Cognitivas, dois paradigmas são propostos para descrever a
cognição humana: a abordagem simbólica e a abordagem conexionista. Ambos
consideram o sistema cognitivo como um sistema de tratamento de informação. O
paradigma simbólico postula a existência de representações mentais através de regras
lógicas e símbolos para explicar a aquisição e a utilização do conhecimento. O
paradigma conexionista parte da premissa de que o processamento cognitivo está
intimamente relacionado à maneira pela qual os neurônios se interconectam no cérebro.
A ideia geral do conexionismo é de que o processamento de informação do
cérebro dá-se por meio de redes neuronais – cujas células nervosas, os neurônios,
comunicam-se umas com as outras através da transmissão de impulsos elétricos (Russel
& Norvig, 2016). No interior deste paradigma, dois objetivos divergentes, mas
complementares, caracterizam o trabalho formulado no âmbito das redes neurais e da
música. Um diz respeito ao desenvolvimento de sistemas musicais inteligentes. O outro
refere-se ao entendimento de um sistema inteligente e musical específico: o cérebro
humano.
74
Os modelos conexionistas têm se mostrado bastante promissores na
compreensão dos processos subjacentes à cognição musical, à apreensão dos padrões
musicais, bem como sobre a representação desse conhecimento (Tillmann, Bharucha &
Bigand, 2001). Esses modelos, denominados Redes Neurais Artificiais (RNA) 12
são
adequados ao entendimento da cognição musical porque podem aprender as
regularidades estruturais de uma cultura musical através da exposição passiva e
formalizar esse conhecimento na conectividade da rede (Bharucha, 2014).
4.1. Modelagens da Cognição Musical em Redes Neurais
Artificiais
a-) Redes SOM e a detecção do centro tonal
É defendido pelos conexionistas que as redes neurais artificiais têm o potencial
de explicar o desenvolvimento dos esquemas cognitivos da música e a subsequente
geração de expectativas musicais baseada em esquemas (Bigand, 2000). Entre os
poucos estudos que modelaram a aquisição do aprendizado perceptual a partir de dados
musicais, a maioria empregou modelos auto-organizados (Chacón, 2017).
As redes do tipo SOM (self-organized maps) são baseadas no modelo de
aprendizagem humano, que não é supervisionado. Elas operam de acordo com modelos
de Aprendizado Competitivo, um algoritmo de aprendizado auto-organizado baseado
em dados. Nenhum tipo de etiqueta é fornecida ao algoritmo, o que faz com que ele
encontre sozinho a solução para o problema. Com este algoritmo, as unidades de rede
neural tornam-se gradualmente sensíveis a diferentes estímulos ou categorias de entrada
(Rumelhart & Zipser, 1985). A especialização ocorre pela competição entre as unidades.
Quando é recebido um input, a unidade que é mais capaz de representá-lo ganha a
competição. A unidade vencedora pode então aprender a representação deste input de
forma ainda melhor. A resposta da unidade será posteriormente mais forte para este
mesmo padrão de entrada e mais fraca para outros estímulos. Da mesma forma, outras
unidades aprendem a se especializar em outros padrões de input (Tillmann, 1999). A
topologia deste tipo de rede é de camada simples e costuma ser uni ou bi dimensional.
12
Artificial neural networks (ANNs)
75
A primeira rede do tipo SOM para detecção de inputs sonoros foi idealizada por
Teuvo Kohonen (1988) e tinha por objetivo identificar padrões vocais da fala humana.
Durante o treinamento, cada grupo de neurônios se especializava em um tipo de som e
assim identificava quando recebia os sinais de entrada. Anos mais tarde, Leman &
Carreras (1995; 1997) atualizaram o modelo de Kohonen para simular o aprendizado
perceptual de centros tonais através da apresentação de acordes de músicas reais. A
apreciação do centro tonal é um processo dinâmico e que varia consideravelmente no
decorrer musical. Primeiramente, o sinal acústico foi processado por um modelo
auditivo. A informação processada pela audição transformou-se no input da SOM,
capaz de extrair as regularidades dos padrões de inputs. Após o treino, a rede fornecia
as ativações em resposta ao estímulo, refletindo a relação harmônica dos acordes com o
estímulo. No experimento de Leman, o sinal de input foi derivado da ativação neural em
resposta a peças de Bach. Com base nas ativações, o centro tonal foi inferido e os
resultados encontrados estavam em conformidade com os estudos em Teoria Musical e
com os dados empíricos colhidos para o experimento.
Sano e Jenkins (1991) e Taylor e Greenhough (1994) também realizaram
experimentos de reconhecimento de tom. Eles formalizam como os processos de
aprendizagem podem ser direcionados por propriedades psicoacústicas de uma maneira
bottom-up (Tillmann, Bharucha & Bigand, 2000). Todavia, estes estudos focaram em
examinar acordes e centros tonais, não dando conta das relações intrínsecas entre tons,
acordes e notas e se mostraram incapazes de demonstrar como a apresentação de uma
nota num determinado contexto gera expectativas referentes aos tons aos quais aquela
nota pertence. (Krumhansl, 1990). Foram necessárias mais investigações sobre como o
conhecimento adquirido a respeito das relações entre tons, notas e acordes podem
influenciar o processamento dos eventos musicais, conduzindo à formação de
expectativas e predições. O mais famoso e expressivo desses modelos chama-se
MUSACT 13
de Bharucha (1987).
13
De “Music ctivation”.
76
b-) MUSACT – Um modelo conexionista de representação do
conhecimento da harmonia tonal
Bharucha (1987) propôs um modelo conexionista de harmonia musical, o
MUSACT, desenvolvido para capturar as intuições e expectativas de harmonia
dependentes de contexto. Para Bharucha, a capacidade de uma rede de aprender
regularidades - alterando os pontos fortes das conexões entre as unidades - permite a
visão parcimoniosa de que a cognição da música é consequência do aprendizado de
princípios gerais operando de acordo com regularidades estruturais do meio ambiente
(Bharucha, 1987).
A arquitetura da rede MUSACT é inspirada nos modelos conexionistas da
representação do conhecimento linguístico, proposto para simular a influência desse
conhecimento sobre o tratamento de palavras escritas ou faladas (Rumelhart &
McClelland, 1982; Elman & McClelland, 1984). A MUSACT é uma rede satisfeita por
restrições para explicar o tratamento da harmonia tonal, onde os estímulos são aplicados
aos neurônios de altura cromática e a resposta da rede é fornecida pela atividade dos
neurônios de acordes e tonalidades. A percepção harmônica é considerada um processo
de satisfação de restrições. Tenta-se explicar como o conhecimento musical pode ser
mentalmente representado e como, uma vez ativado por um determinado contexto
musical, esse conhecimento pode influenciar o processamento mental e as expectativas
tonais.
No MUSACT, as representações mentais de notas, acordes e tons são
organizadas hierarquicamente. A representação de um acorde é determinada tanto pelas
notas que o constituem quanto pela representação de tonalidade do contexto musical em
que se insere. A MUSACT consiste em três camadas de neurônios que representam
respectivamente as 12 alturas cromáticas, os 24 acordes maiores e menores e os 12 tons
principais. A conectividade entre essas camadas reflete as restrições elementares da
harmonia tonal ocidental, ou seja, as relações mantidas entre notas e acordes, por um
lado, e entre acordes e tons, por outro. Assim, cada neurônio de altura cromática está
conectado a todos os acordes aos quais pertence, e esses neurônios de acordes sendo
eles próprios conectados a todos os neurônios que representam os tons aos quais
pertencem.
O fluxo de informações na rede é bidirecional, a ativação é propagada tanto das
camadas mais baixas para as camadas superiores, quanto das camadas superiores para as
77
inferiores. Este mecanismo permite o surgimento de interações ascendentes e
descendentes no tratamento da harmonia.
Apresentando-se um estímulo (input) constituído por uma tríade de notas, este
ativa as células de notas correspondentes, por exemplo, C-E-G, para o acorde de Dó
Maior, conforme a imagem abaixo:
Figura 19 - Ativações bottom-up e top-down reverberadas pelo modelo MUSACT após a representação de um acorde
de Dó maior. (Bharucha, 1987)
Esta atividade propaga-se para os neurônios de acordes, que ativam os neurônios
de tom (setas pretas). O padrão de ativação então reverbera na rede retornando à camada
de acordes e notas (setas cinza) que, por manter relações harmônicas de IV e V grau
com o tom (ver o Ciclo de Quintas) são altamente prováveis de serem ativadas pela
tríade inicial.
78
O nível de ativação dos neurônios da nota (correspondente à camada de entrada
da rede) é determinado pelo estímulo, enquanto a ativação de todas as outras unidades
resulta da propagação da ativação ponderada e do declínio temporal desta.
Na fase de reverberação, desde a ativação inicial até o equilíbrio, os padrões de
ativação mudam consideravelmente. O sistema é dinâmico e seu estado muda
gradualmente, conforme a estimulação contínua. A atividade na rede é propagada de
uma maneira fásica: a ativação transmitida por uma determinada célula é proporcional à
diferença entre seu estado de ativação e os sinais que recebeu na entrada, isto é,
modulada pela mudança de ativação das outras unidades conectadas a ela. Durante cada
ciclo de processamento, a ativação de uma determinada unidade corresponde a sua
ativação durante o ciclo anterior, mais a soma ponderada das ativações fásicas que a
alcançam. A propagação das ativações fásicas continua na rede até atingir um estado de
equilíbrio estável. No estágio de equilíbrio, o estado das ativações da rede incorpora
também influências descendentes.
Este experimento tenta descrever como é possível o cérebro desenvolver uma
hierarquia tonal. Para Tillmann (s/d), o estado da rede reflete as hierarquias teóricas da
gramática musical ocidental. A idéia essencial é de que o contexto musical estabelece
uma hierarquia de tons. Certos tons musicais são mais proeminentes, estáveis e
estruturalmente significativos do que outros. As regras musicais ocidentais não são
armazenadas explicitamente, mas emergem da ativação que reverbera através de
conexões entre tons, acordes e notas. A ativação tende a diminuir com o aumento da
distância harmônica entre os acordes em função do Ciclo de Quintas, que falamos
anteriormente.
O modelo MUSACT aborda a acumulação de expectativas harmônicas ao longo
do tempo. Para seqüências de acordes, a ativação é acumulada. O nível de ativação nas
unidades de acordes é interpretado como a força das expectativas para outros acordes
recebidos - dado o contexto previamente apresentado. (Bigand, 2000).
Uma vez que o modelo tenha atingido o equilíbrio após um evento, o padrão de
ativação começa a decair exponencialmente ao longo do tempo. Se outro evento ocorrer
antes da ativação decair sensivelmente, a ativação fásica deste próximo evento é
adicionada à ativação residual do evento anterior, criando um padrão de ativação que
pode ser influenciado por uma seqüência completa de eventos (Tillmann, s/d).
São reconhecidas as limitações estruturais e funcionais do modelo MUSACT.
Ele, por exemplo, pressupõe a equivalência de oitavas e não pode explicar as diferentes
79
disposições das notas em um acorde, nem as reversões deste. O corpus de treinamento
usado nesses estudos é baseado em um modelo de harmonia clássica que leva em conta
apenas tríades, isto é, acordes de três tons e apenas os tons principais. É difícil conceber
como essa abordagem poderia ser aplicada a estilos musicais com estruturas harmônicas
muito mais complexas, como o jazz. O MUSACT não prevê uma série de fenômenos
relacionados à percepção harmônica, embora ele possa explicar certos aspectos da
hierarquia tonal, como a facilitação relativa ao tratamento tônico em relação ao
dominante e subdominante (IV, V). Além disso, quando essas três funções tonais são
comparadas com suas respectivas linhas de base, o modelo prediz corretamente a
facilidade de tratamento do tônico, mas prevê uma facilitação da inibição da
subdominante em acordes dominantes (Tillmann et al. 2008).
Outros estudos com redes neuronais abordaram o aprendizado de oitava
(Bharucha & Menel, 1996), a classificação de acordes (K. Lee, 2006), a aprendizagem
de sequências melódicas (Todd, 1991). Estudos análogos aos de Bharucha também
simularam em alto grau de complexidade a aprendizagem e percepção musical, tentando
compreender como categorizamos e memorizamos propriedades dos padrões musicais.
Griffiths (1999) também formalizou como as múltiplas relações entre tons, acordes e
notas podem ser representados em um único framework.
80
5. Discussão - Enquadramento Filosófico da Hipótese das
Expectativas: uma interpretação formalista da fruição
musical
Leonard Meyer (1956) entende que as significações expressivas da música
nascem da relação entre as estruturas formais com as expectativas do ouvinte. Esta
abordagem vai ao encontro de Hanslick (1994), para quem a o prazer na escuta musical
não emerge da indução específica de estados de humor ou emoções discretas, mas da
apreciação pura.
Em Do Belo Musical, um marco na musicologia escrito em 1854, o filósofo
austríaco Eduard Hanslick faz uma abordagem estética da beleza musical. Ele critica a
ideia de que o objetivo da música é suscitar sentimentos no ouvinte e de que o conteúdo
da música são os sentimentos. Hanlisck assume uma posição objetivista e advoga que o
conteúdo ou objetivo da música não é a expressão de emoções e esta não esta possui
qualquer significado emocional. O belo musical não depende dos sentimentos que
provoca. Ele constitui uma qualidade do objeto quando absorvido por uma faculdade
contemplativa e racional. Hanslick sublinha a objetividade, apontando para o material
musical como substrato do alicerce estético do significado musical e enfatiza a diferença
entre sensação e sentimento. A fruição do belo musical acontece em puramente função
do ato contemplativo de um ouvir atento. O sentimento é consequência do ato
perceptual que age sobre os processos fisiológicos. Diz ele: “não só para a música, mas
para todas as artes, o efeito do belo sobre o sentimento é secundário”.
O belo musical reside na contemplação pura da forma e não nos sentimentos do
compositor ou do ouvinte, que são eventos secundários. Para Hanslick, a peça sonora é
criada na fantasia do artista e será interpretada também na fantasia do ouvinte. “Diante
do belo, a fantasia não é apenas um contemplar, mas um contemplar com
entendimento”.
Filiamos-nos à perspectiva musicológica formalista e objetivista da música,
capitaneada por Hanslick e atualmente alardeada por Nick Zangwill (Zangwill, 2015), e
mais moderadamente por Peter Kivy, para a interpretação do prazer musical.
Zangwill afirma que, embora a música e a experiência musical possam manter
relações causais com as emoções e com os estados de espírito (um estado emocional ou
o humor de alguém podem fazer com que esta pessoa componha uma música, ou uma
pessoa pode entrar em um estado emocional ou de humor em virtude de ouvir uma
81
música), a experiência imediata da música não é nem uma emoção nem um humor. Isso,
evidentemente, para aquilo que denomina-se música absoluta, desprovida de letra e
referências exteriores à própria música e, por conseguinte, de conteúdo semântico.
Para Zagwill, uma vez que a música é o próprio objeto intencional da
experiência musical, ela fica impossibilitada de satisfazer as condições necessárias para
que um estado mental seja considerado emoção: possuir relações essenciais com crenças
e possuir objetos intencionais. A música não possui nenhum objeto intencional senão
ela mesma, logo não é a representação de uma emoção.
Aquiescemos com esta perspectiva por uma evidência simples: a gratificação
gerada nas vias mesolímbicas é anterior ao processamento e à avaliação emocional do
estímulo pelo córtex órbitofrontal (Kringelbach, 2014). Argumentamos que música
oferece ao ouvinte uma experiência gratificante e prazerosa porque explora a
competência do cérebro para fazer Codificação Preditiva, evoca respostas fisiológicas
semelhantes à do medo quando há um erro positivo de predição e por ele é
recompensado. A emergência de emoções é secundária a este processo.
Apreciamos música porque ela é um sistema complexo que explora a capacidade
do cérebro de ser surpreendido. Neste sentido, devemos reverência a Hanslick: para nós,
o prazer musical se relaciona mais com o desenrolar dos sons do que com as emoções
que suscita.
82
IV. Considerações Finais
O presente trabalho buscou compreender as razões pelas quais os humanos
sentem prazer durante a escuta musical. Foi detectado que a música ativa o sistema
dopaminérgico nas vias mesolímbicas, reconhecidas pelo papel neurobiológico na
sensação de prazer. É sugerido que as vias mesolímbicas geram gratificação sempre que
uma aposta sobre o desenrolar de eventos é confirmada, porém, a gratificação ocorre de
forma mais intensa quando há um erro positivo de predição, com uma resposta
dopaminérgica maior, no intuito de reforçar o comportamento adaptativo.
A aquisição de uma sintaxe musical dá-se pela apreensão das regularidades
estatísticas. As regularidades são internalizadas por aprendizagem implícita desde o
útero materno. Pela exposição à oferta estatística dos padrões musicais, criam-se
modelos mentais para a interpretação do input, desenvolvendo uma gramática subjetiva
da estrutura tonal, codificada nas conexões neuronais. O grau de subjetividade
associado a este processo cognitivo oferece dificuldade epistemológica e metodológica
na descrição de uma gramática individual. Entretanto, experimentos com redes neurais
forneceram-nos um melhor entendimento do que pode ser este processo, em especial o
modelo MUSACT de Bharucha, em que a ativação que se propaga pela rede neural
simula a influência do contexto harmônico para expectativas. As relações de harmonia
emergem da reverberação da rede MUSACT.
O modelo MUSACT integra fatores ascendentes e descendentes (bottom-up e
top-down) das duas grandes classes de estruturas cognitivas postuladas para a
apreciação musical: uma estrutura esquemática, que representa as regularidades
estruturais abstratas da música (reforçadas como gramáticas) e outra correspondente às
regularidades da própria música, das sequências particulares que a representam. O
tratamento ascendente interpreta as influências para as expectativas exercidas pelas
características psicoacústicas do ambiente auditivo e do estímulo. O tratamento
descendente daria conta das influências de conhecimentos anteriores adquiridos por
exposição a uma cultura musical.
A perspectiva integrativa permite a compreensão processamento musical como
interação entre duas gramáticas: uma individual - adquirida implicitamente - e a
gramática do idioma tonal. A gramática individual atualiza-se constantemente conforme
83
exposição, de acordo com as propostas bayesianas para o processamento cerebral,
baseado em incertezas (visto o caráter entrópico e estocástico do estímulo musical),
buscando um modelo mais preciso no processamento dos inputs sensoriais.
Possivelmente o prazer musical emerge da aliança da gramática composicional
com a gramática do ouvinte, que possibilita a expectativa. Uma peça é ouvida como
culturalmente anômala na medida em que as expectativas do ouvinte são
impossibilitadas ou sistematicamente violadas. De fato, as redes neurais demonstram
que as forças de conexão entre as unidades são minimizadas ao longo de exposição com
discrepâncias entre as expectativas geradas e as probabilidades de transição.
David Huron evidenciou algumas regularidades detectadas na composição de
frases musicais. Já Krumhansl demonstrou que quanto maior a consonância entre notas,
maior a expectativa sobre elas. Um compositor pode optar por satisfazer ou violar essas
expectativas em níveis variados, evocando, por exemplo, os diferentes graus de
consonância e dissonância no Ciclo de Quintas. O valor estético desse jogo sutil figurou
em numerosos escritos teóricos sobre composições tonais (George Mandler, 1984;
Leonard Meyer, 1956).
Todavia, porque a composição musical é feita segundo regras violáveis (regras
preferenciais), é possível incluir elementos ótimos na estrutura musical, conforme a
Teoria da Otimalidade. Esses elementos vão suscitar erros positivos de predição,
desencadeando um aumento no disparo dopaminérgico nas estruturas mesolímbicas,
despertando o Ciclo do Prazer e a resposta hedônica subsequente.
A composição que desperta mais prazer nos ouvintes é talvez aquela que recruta
de maneira mais completa seus recursos cognitivos, tais como a memória, a capacidade
de aprendizagem implícita e a realização de predições. A melhor música talvez seja
aquela cujas regras composicionais burlam as expectativas de forma ótima, subvertendo
o esquema mental do ouvinte com melhores soluções do que aquelas previstas por seu
quadro cognitivo, consoante sua gramática individual. Audições pobres e limitadas logo
são absorvidas e deixam de despertar uma maior amplitude das redes neuronais. Por
isso, quanto maior o repertório oferecido aos nossos ouvidos, tanto melhor para a
fruição musical.
84
Compreende-se a musicalidade como um fenômeno cultural inextricável ao
cérebro humano. Um produto natural e social: natural porque explora estruturas
evolutivas importantes (codificação preditiva, sistema de recompensa, aprendizagem,
resposta hedônica, resposta ao medo, estruturas da linguagem) para as quais cada
indivíduo possui uma estrutura biológica que permitem a capacidade musical; social por
se manifestar de acordo com as regras culturais pré-existentes, tais como o idioma tonal.
Ao cabo, esta pesquisa não ofereceu subsídios para concluir a respeito do caráter
adaptativo ou sobre alguma vantagem evolutiva relacionada ao fenômeno musical.
Detectamos que a música contribui para a nossa felicidade em geral, sem custos
biológicos (evolutivos) acrescidos. Se a música é um mero cheesecake auditivo ou não,
não podemos responder com esta dissertação. São necessárias outras pesquisas em
Neuropsicologia e Psicologia Comportamental relacionando, por exemplo, a escuta
musical e o aumento do comportamento cooperativo e/ou empatia entre grupos de
ouvintes, bem como investigações de análises imagiológicas dos correlatos neurais e
neurotransmissores associados a esses comportamentos.
85
V. Referências
Abdallah S. & Plumbley M. (2008); “Information dynamics: atterns of expectation and
surprise in the perception of music”. Connection cience.
Asaad, W. F., & Eskandar, E. N. (2011). Encoding of both Positive and Negative Reward
Prediction Errors by Neurons of the Primate Lateral Prefrontal Cortex and Caudate Nucleus.
The Journal of Neuroscience, 31(49), 17772–17787. http://doi.org/10.1523/JNEUROSCI.3793-
11.2011
Bernstein, Leonard (1976). The Unanswered Question: Six Talks at Harvard. Cambridge:
Harvard University Press. ISBN 0674920015.
Berridge, K. C. (2006). The debate over dopamine’s role in reward: the case for incentive
salience. Psychopharmacology, 191(3), 391-431. doi:10.1007/s00213-006-0578-x
Berry, D.C., & Dienes, Z. (1993). Implicit learning: Theoretical and empirical issues. Hove,
England: Erlbaum.
Besson, M., & Faïta, F. (1995). An event-related potential (ERP) study of musical expectancy:
Comparison of musicians with nonmusicians. Journal of Experimental Psychology: Human
Perception and Performance, 21(6), 1278-1296. doi:10.1037//0096-1523.21.6.1278
Besson, Mireille & Schön, Daniele. (2001). Comparison Between Language and Music. Annals
of the New York Academy of Sciences. 930. 232-58. 10.1111/j.1749-6632.2001.tb05736.x.
Bharucha JJ, Menel WE (1996) Two issues in auditory cognition: self-organization of octave
categories and pitch-invariant pattern recognition. Psychol Sci 7: 142–149
Bharucha, J. J. & Olney, K. L. (1989). Tonal cognition, artificial intelligence and neural nets,
Contemporary Music Review, 4, 341-356.
Bharucha, J. J. (1987). Music cognition and perceptual facilitation: A connectionist framework.
Music Perception , 5, 1-30.
Bharucha, J. J., & Stoeckig, K. (1987). Priming of chords: Spreading activation or
overlapping frequency spectra? Perception & Psychophysics, 41(6), 519-524.
doi:10.3758/bf03210486
Bharucha, J. J., & Krumhansl, C. (1983). The representation of harmonic structure in music:
Hierarchies of stability as a function of context. Cognition, 13
Bharucha, J. J., & Stoeckig, K. (1986). Reaction time and musical expectancy: Priming
Blood, A. J., & Zatorre, R. J. (2001). Intensely pleasurable responses to music correlate with
activity in brain regions implicated in reward and emotion. Proceedings of the National
Academy of Sciences, 98(20), 11818-11823. doi:10.1073/pnas.191355898
Bosch, I. V., Salimpoor, V. N., & Zatorre, R. J. (2013). Familiarity mediates the relationship
between emotional arousal and pleasure during music listening. Frontiers in Human
Neuroscience, 7. doi:10.3389/fnhum.2013.00534
86
Brown, S., Martinez, M. J., & Parsons, L. M. (2004). Passive music listening spontaneously
engages limbic and paralimbic systems. NeuroReport, 15(13), 2033-2037.
doi:10.1097/00001756-200409150-00008
Cannon, C., & Bseikri, M. (2004). Is dopamine required for natural reward? Physiology
& Behavior, 81(5), 741-748. doi:10.1016/j.physbeh.2004.04.020
Chanda, M. L., & Levitin, D. J. (2013). The neurochemistry of music. Trends in Cognitive
Sciences, 17(4), 179-193. doi:10.1016/j.tics.2013.02.007
Cox, Gregory. "On the relationship between entropy and meaning in music: An exploration with
recurrent neural networks." In Proceedings of the Cognitive Science Society, vol. 32, no. 32.
2010.
Shannon, C. (1948). “ mathematical theory of communication”. Bell ystems Technical
Journal.
Cleeremans, A. (1993). Mechanisms of implicit learning: Connectionist models of sequence
processing. Cambridge, MA: MIT Press.
Darwin, C. (1963). The origin of species by means of natural selection: the descent of man and
selection in relation to sex. Chicago.
Dalley, J. (n.d.). Faculty of 1000 evaluation for Prolonged dopamine signalling in striatum
signals proximity and value of distant rewards. F1000 - Post-publication peer review of the
biomedical literature. doi:10.3410/f.718058213.793482355
Deutsch, D. (2010). Speaking in Tones. Scientific American Mind,21(3), 36-43.
doi:10.1038/scientificamericanmind0710-36
Dennett, D. C. (2013). Kinds of minds. London: Phoenix.
Dienes, Z., & Perner, J. (1995). Implicit knowledge in people and connectionist
networks. Implicit Cognition, 227-256.
doi:10.1093/acprof:oso/9780198523109.003.0006
Dutton, D. (2005). Aesthetics and Evolutionary Psychology. The Oxford Handbook of
Aesthetics. doi:10.1093/oxfordhb/9780199279456.013.0041
Ettlinger, M., Margulis, E. H., & Wong, P. C. (2011). Implicit Memory in Music and
Language. Frontiers in Psychology,2. doi:10.3389/fpsyg.2011.00211
F. Adams & K. Aizawa. Whatever next? Predictive brains, situated agents, and the future of
cognitive science. (2013). Behavioral and Brain Sciences Behav Brain Sci, 36(03), 181-204.
doi:10.1017/s0140525x12000477
Fibiger, H.C., Carter, D. & Phillips, A. (1976). Decreased intracranial self-stimulation
87
after neuroleptics or 6-hydroxydopamine: evidence for mediation by motor deficits rather than
by reduced reward. Psychopharmacology, 47, 21-27.
Filho, F. M. (2004). acústica musical em palavras e sons. Cotia, : teliê.
Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews
Neuroscience, 11(2), 127-138. doi:10.1038/nrn2787
Karl, F. (2012). A Free Energy Principle for Biological Systems. Entropy,14(12), 2100-2121.
doi:10.3390/e14112100
G., Cox. (n.d.). On the Relationship Between Entropy and Meaning in Music: An Exploration
with Recurrent Neural Networks. Retrieved from http://www.indiana.edu/~clcl/Papers/gcox-
music entropy-140510.pdf
Gebauer, L., Kringelbach, M. L., & Vuust, P. (2012). Ever-changing cycles of musical pleasure:
The role of dopamine and anticipation. Psychomusicology: Music, Mind, and Brain, 22(2), 152-
167. doi:10.1037/a0031126
Griffith, N. (1999). Musical networks: parallel distributed perception and performance.
Cambridge: MIT Press.
Grossberg, S. (1982). Processing of expected and unexpected events during conditioning and
attention: A psychophysiological theory. Psychological Review,89(5), 529-572.
doi:10.1037/0033-295x.89.5.529
Gold, B. P., Frank, M. J., Bogert, B., & Brattico, E. (2013). Pleasurable music affects
reinforcement learning according to the listener. Frontiers in Psychology, 4.
doi:10.3389/fpsyg.2013.00541
Hanslick, E. (1994). Do Belo Musical. Lisboa: edições 70.
Honing, H. (paperback in press, 2013) Musical Cognition. A Science of Listening. New
Brunswick, N.J.: Transaction Publishers.
Huettel SA. (2005) Decisions under Uncertainty: Probabilistic Context Influences Activation of
Prefrontal and Parietal Cortices. J Neurosci. 2005;25: 3304–3311.
doi:10.1523/JNEUROSCI.5070-04.2005
Huron, D. B. (2006). Sweet anticipation: Music and the psychology of expectation. Cambridge,
MA: MIT Press.
Janata, P. (2002). The Cortical Topography of Tonal Structures Underlying Western Music.
Science, 298(5601), 2167-2170. doi:10.1126/science.1076262
K. Lee. Automatic chord recognition using enhanced pitch class profile. In Proceedings of the
International Computer Music Conference (ICMC), pages 306–313, 2006.
88
Kandel, E. R., Schwartz, J. H., & Jessel, T. M. (2014). rincipios da neurociência.
Barueri, SP: Manole.
Kantono, K., Hamid, N., Shepherd, D., Yoo, M. J., Grazioli, G., & Carr, B. T. (2016). Listening
to music can influence hedonic and sensory perceptions of gelati. Appetite, 100, 244-255.
doi:10.1016/j.appet.2016.02.143
Knill DC, Pouget A. (2004) The Bayesian brain: the role of uncertainty in neural coding and
computation. Trends Neuroscience;27: 712–719. doi:10.1016/j.tins.2004.10.007
Koelsch, S. (2005). Neural substrates of processing syntax and semantics in music. Elsevier.
DOI 10.1016/j.conb.2005.03.005
Koelsch, S. (2010). Towards a neural basis of music-evoked emotions. Trends in Cognitive
Sciences, 14(3), 131-137. doi:10.1016/j.tics.2010.01.002
Koelsch, S. (2011). Toward the neural basis of music perception: A review and update (2nd ed.,
Vol. 1, Ser. 110). Frontiers In PsychologyNational Library of Medicine.
Koelsch, S. (2014). Brain correlates of music-evoked emotions. Nature Reviews Neuroscience,
15(3), 170-180. doi:10.1038/nrn3666
Koelsch, S. (2015). Music-evoked emotions: principles, brain correlates, and implications for
therapy. Annals of the New York Academy of Sciences, 1337(1), 193-201.
doi:10.1111/nyas.12684
Kringelbach, M. L., & Phillips, H. (2014). Emotion: pleasure and pain in the brain. Oxford:
Oxford University Press.
Kringelbach, Morten L. "The human orbitofrontal cortex: linking reward to hedonic
experience." Nature Reviews Neuroscience 6.9 (2005): 691-702. Web.
Krumhansl, C. L., & Cuddy, L. L. (2010). A Theory of Tonal Hierarchies in Music. Music
Perception Springer Handbook of Auditory Research, 51-87. doi:10.1007/978-1-4419-6114-3_3
Krumhansl, C. L., & Cuddy, L. L. (2010). A Theory of Tonal Hierarchies in Music. Music
Perception Springer Handbook of Auditory Research, 51-87. doi:10.1007/978-1-4419-6114-3_3
Kutas, M., & Hillyard, S. (1980). Reading senseless sentences: brain potentials reflect semantic
incongruity. Science,207(4427), 203-205. doi:10.1126/science.7350657
Laske, O. E. (2004). Music, memory, and thought: explorations in cognitive musicology. Ann
Arbor, MI: UMI Books on Demand.
Lawless, M. S., & Vigeant, M. C. (2015). Investigating the emotional response to room
acoustics: A functional magnetic resonance imaging study. The Journal of the Acoustical
Society of America, 138(4). doi:10.1121/1.4933232
Laran, J., Janiszewski, C., & Cunha Jr., M. (2008). Context-Dependent Effects of Goal Primes.
Journal of Consumer Research, 35(4), 653–667.
89
Leman, M. (1995). Music and Schema Theory. Springer: Berlin.
Leman, M., & Carreras, F. (1997). Schema and gestalt: Testing the hypothesis of psychoneural
isomorphism by computer simulation. Music, Gestalt, and Computing Lecture Notes in
Computer Science,144-168. doi:10.1007/bfb0034112
Lerdahl, F., & Jackendoff, R. (1996). A generative theory of tonal music. Cambridge:
The MIT Press.
Levitin, D. J. (2016). This is your brain on music: the science of a human obsession. New York,
NY: Dutton.Journal of Aesthetic Education.
Mallik, A., Chanda, M. L., & Levitin, D. J. (2017). Anhedonia to music and mu-opioids:
Evidence from the administration of naltrexone. Scientific Reports, 7, 41952.
doi:10.1038/srep41952
Mantione, M., Figee, M., & Denys, D. (2014). A case of musical preference for Johnny Cash
following deep brain stimulation of the nucleus accumbens. Frontiers in Behavioral
Neuroscience, 8. doi:10.3389/fnbeh.2014.00152
Mavridis, I.N. Surg Radiol Anat (2015) 37: 121. https://doi.org/10.1007/s00276-014-1360-0
Mcclelland, J. L., & Elman, J. L. (1986). The TRACE model of speech perception. Cognitive
Psychology,18(1), 1-86. doi:10.1016/0010-0285(86)90015-0
Mcdermott, J., & Hauser, M. (2005). The Origins Of Music: Innateness, Uniqueness, And
Evolution. Music Perception, 23(1), 29-59. doi:10.1525/mp.2005.23.1.29
Menon, V., & Levitin, D. (2005). The rewards of music listening: Response and physiological
connectivity of the mesolimbic system. NeuroImage, 28(1), 175-184.
doi:10.1016/j.neuroimage.2005.05.053
M. (2013, March 19). Retrieved October 23, 2017, from
https://www.youtube.com/watch?v=IbgOcXar9UA
Meyer, L. B. (1956). Emotion and meaning in music. Chicago: University of Chicago Press.
Meyer, L. B. (1967). “Music, the arts and ideas: patterns and predictions in the twentieth-
century culture”. University of Chicago ress.
Miller, G. F. (2000). Evolution of human music through sexual selection. In N. L. Wallin, B.
Merker, & S. Brown (Eds.), The origins of music, MIT Press, pp. 329-360.
Mitterschiffthaler, M. T., Fu, C. H., Dalton, J. A., Andrew, C. M., & Williams, S. C. (2007). A
functional MRI study of happy and sad affective states induced by classical music. Human
Brain Mapping, 28(11), 1150-1162. doi:10.1002/hbm.20337
90
Montag, C., Reuter, M., & Axmacher, N. (2011). How one's favorite song activates the reward
circuitry of the brain: Personality matters! Behavioural Brain Research, 225(2), 511-514.
doi:10.1016/j.bbr.2011.08.012
Mueller, K., Fritz, T., Mildner, T., Richter, M., Schulze, K., Lepsien, J., . . . Möller, H. E.
(2015). Investigating the dynamics of the brain response to music: A central role of the ventral
striatum/nucleus accumbens. NeuroImage, 116, 68-79. doi:10.1016/j.neuroimage.2015.05.006
NeuroReport, 20(13), 1204-1208. doi:10.1097/wnr.0b013e32832f4da3
Muniz, M. (2012). Implicações dos mecanismos de recompensa e cognição implícita na
formação de expectativas e manutenção do caráter funcional da música tonal. USP. São Paulo.
Neal, A. & Hesketh, B. Psychonomic Bulletin & Review (1997) 4: 24.
https://doi.org/10.3758/BF03210770
Olds, J., & Milner, P. (1954). Positive reinforcement produced by electrical stimulation of septal
area and other regions of rat brain. Journal of Comparative and Physiological Psychology,
47(6), 419-427.
Olds, J. (1956). A preliminary mapping of electrical reinforcing effects in the rat brain. Journal
of Comparative and Physiological Psychology, 49, 281-285.
Osuch, E. A., Bluhm, R. L., Williamson, P. C., Théberge, J., Densmore, M., & Neufeld, R. W.
(2009). Brain activation to favorite music in healthy controls and depressed patients.
Patel, A. D. (2008). Music, language, and the brain. New York, NY: Oxford University Press.
Pätynen, J., & Lokki, T. (2016). Concert halls with strong and lateral sound increase the
emotional impact of orchestra music. The Journal of the Acoustical Society of America, 139(3),
1214-1224. doi:10.1121/1.4944038
Paulino, D., Amaral Turkman, M.A., Murteira, B. E Faria, J.F. (2003) Estatística Bayesiana,
Fundação Calouste Gulbenkian, Lisboa
Pearce, M. T., & Wiggins, G. A. (2006). Expectation in Melody: The Influence of Context and
Learning. Music Perception, 23(5), 377-405. doi:10.1525/mp.2006.23.5.377
Pereira, C. S., Teixeira, J., Figueiredo, P., Xavier, J., Castro, S. L., & Brattico, E. (2011). Music
and Emotions in the Brain: Familiarity Matters. PLoS ONE, 6(11).
doi:10.1371/journal.pone.0027241
Peretz, I., & Zatorre, R. J. (2005). Brain Organization for Music Processing. Annual Review of
Psychology Annu. Rev. Psychol., 56(1), 89-114. doi:10.1146/annurev.psych.56.091103.070225
Perlovsky, L., Cabanac, A., Bonniot-Cabanac, M., & Cabanac, M. (2013). Mozart effect,
cognitive dissonance, and the pleasure of music. Behavioural Brain Research, 244, 9-14.
doi:10.1016/j.bbr.2013.01.036
91
Perruchet, P., & Pacton, S. (2006). Implicit learning and statistical learning: one phenomenon,
two approaches. Trends in Cognitive Sciences, 10(5), 233-238. doi:10.1016/j.tics.2006.03.006
Pinker, S. (1997). How the mind works. London: Penguin Books.
Prince, A., & Smolensky, P. (n.d.). Optimality Theory: Constraint Interaction in Generative
Grammar. Optimality Theory in Phonology, 1-71. doi:10.1002/9780470756171.ch1
Reber, A. S. (1967). Implicit learning of artificial grammars. Journal of Verbal Learning and
Verbal Behavior, 6(6), 855-863. doi:10.1016/s0022-5371(67)80149-x
Reber, A.S. (1993). Implicit learning and tacit knowledge. An essay on the cognitive
unconscious. New York: Oxford University Press.
Rottenberg, A., & Lindy,]. (1965). Effects of the availability of rewarding septal and
hypothalamic stimulation on bar pressing for food under conditions of deprivation. Journal of
Comparative and Physiological Psychology, 60, 158-161.
Rumelhart, D. E., & Mcclelland, J. L. (1982). An interactive activation model of context effects
in letter perception: II. The contextual enhancement effect and some tests and extensions of the
model. Psychological Review,89(1), 60-94. doi:10.1037//0033-295x.89.1.60
Rumelhart and D. Zipser, (1985) "Feature Discovery by Competitive Learning," Cognititive
Science Vol. 9, pp. 75-1 12.
Russell, S. J., & Norvig, P. (2016). Artificial intelligence: a modern approach. Boston: Pearson.
Rochol, J. (2011). Comunicação de Dados(1º Edição ed., Vol. 22). Porto Alegre: Bookman.
Saffran JR. (2002) Constraints on statistical language learning. Journal of Memory and
Language.47:172–196.
Salimpoor, V. N., Benovoy, M., Larcher, K., Dagher, A., & Zatorre, R. J. (2011). Anatomically
distinct dopamine release during anticipation and experience of peak emotion to music. Nature
Neuroscience, 14(2), 257-262. doi:10.1038/nn.2726
Salimpoor, V. N., Benovoy, M., Longo, G., Cooperstock, J. R., & Zatorre, R. J. (2009). The
Rewarding Aspects of Music Listening Are Related to Degree of Emotional Arousal. PLoS
ONE, 4(10). doi:10.1371/journal.pone.0007487
Salimpoor, V. N., Bosch, I. V., Kovacevic, N., Mcintosh, A. R., Dagher, A., & Zatorre, R. J.
(2013). Interactions Between the Nucleus Accumbens and Auditory Cortices Predict Music
Reward Value. Science, 340(6129), 216-219. doi:10.1126/science.1231059
Salimpoor, V. N., Zald, D. H., Zatorre, R. J., Dagher, A., & Mcintosh, A. R. (2015). Predictions
and the brain: how musical sounds become rewarding. Trends in Cognitive Sciences, 19(2), 86-
91. doi:10.1016/j.tics.2014.12.001
92
Sano, H., & Jenkins, B. K. (1989). A Neural Network Model for Pitch Perception. Computer
Music Journal,13(3), 41. doi:10.2307/3680010
Savage, P. E., Brown, S., Sakai, E., & Currie, T. E. (2015). Statistical universals reveal the
structures and functions of human music. Proceedings of the National Academy of Sciences,
112(29), 8987-8992. doi:10.1073/pnas.1414495112
Shepard, R. N. (2001). Perceptual-cognitive universals as reflections of the world. Behavioral
and Brain Sciences,24(04). doi:10.1017/s0140525x01000012
Schoenberg, Arnold. 1975. Style and Idea: Selected Writings of Arnold Schoenberg. Edited by
Leonard Stein, with translations by Leo Black. New York: St. Martins Press; London: Faber &
Faber. ISBN 0-520-05294-3.
Schultz, W. (2013). Updating dopamine reward signals. Current Opinion in Neurobiology,
23(2), 229-238. doi:10.1016/j.conb.2012.11.012
Schultz, W. (2016). Dopamine reward prediction-error signalling: a two-component response.
Nature Reviews Neuroscience, 17(3), 183-195. doi:10.1038/nrn.2015.26
Squire, Larry R ; Kandel, Eric R (2003). Memória - da Mente às Moléculas. ARTMED
Stadler, M.A., & Frensch, P.A. (1998). (Eds.). Handbook of implicit learning. Thousand Oaks,
CA: Sage.
T. Kohonen, "The Neural Phonetic Typewriter", Computer, vol. 21, no. 3, 1988, pp.11
Todd, P. M., & Loy, D. G. (1991). Music and connectionism. Cambridge, MA: MIT Press.
Taylor I., Greenhough M. (1994). Modelling pitch perception with adaptive resonance theory
artificial neural networks. Connect. Sci. 6, 135–154. 10.1080/09540099408915721
Tillmann, B., Bharucha, J. J., & Bigand, E. (2001). Implicit Learning of Regularities in Western
Tonal Music by Self-Organization. Perspectives in Neural Computing Connectionist Models of
Learning, Development and Evolution, 175-184. doi:10.1007/978-1-4471-0281-6_18
Tononi, G. (1998). Consciousness and Complexity. Science,282(5395), 1846-1851.
doi:10.1126/science.282.5395.1846
Trost, W., Ethofer, T., Zentner, M., & Vuilleumier, P. (2011). Mapping Aesthetic Musical
Emotions in the Brain. Cerebral Cortex, 22(12), 2769-2783. doi:10.1093/cercor/bhr353
Trost, W., Frühholz, S., Cochrane, T., Cojan, Y., & Vuilleumier, P. (2015). Temporal dynamics
of musical emotions examined through intersubject synchrony of brain activity. Social
Cognitive and Affective Neuroscience, 10(12), 1705-1721. doi:10.1093/scan/nsv060
Valverde, M. (2017). A Canção como vetor identitário: experiência musical no Ocidente
e no mundo globalizado. Anais do SEFIM, 3(3).
93
Villarreal, E. A., Brattico, E., Leino, S., Østergaard, L., & Vuust, P. (2011). Distinct neural
responses to chord violations: A multiple source analysis study. Brain Research, 1389, 103-114.
doi:10.1016/j.brainres.2011.02.089
Von Hippel, P. (2000) Redefining pitch proximity: tessitura and mobility as constraints on
melodic intervals. Music Perception 17 (3).
Vos, P. G., & Troost, J. M. (1989). Ascending and Descending Melodic Intervals: Statistical
Findings and Their Perceptual Relevance. Music Perception: An Interdisciplinary Journal, 6(4),
383-396. doi:10.2307/40285439
Vuust, P., & Witek, M. A. (2014). Rhythmic complexity and predictive coding: a novel
approach to modeling rhythm and meter perception in music. Frontiers in Psychology, 5.
doi:10.3389/fpsyg.2014.01111
Vuust, P., and Kringelbach, M. L. (2010). The pleasure of making sense of music. Interdiscipl.
Sci. Rev. 35, 166–182. doi: 10.1179/030801810X12723585301192
Vuust, P., Ostergaard, L., Pallesen, K. J., Bailey, C., and Roepstorff, A. (2009). Predictive
coding of music-brain responses to rhythmic incongruity. Cortex 45, 80–92.
doi:10.1016/j.cortex.2008.05.014
Wang, T. (2015). A hypothesis on the biological origins and social evolution of music and
dance. Frontiers in Neuroscience, 9. doi:10.3389/fnins.2015.00030
Weigmann, K. (2017). Feel the beat. EMBO reports, 18(3), 359-362.
oi:10.15252/embr.201743904
Winograd, S. (1968) A New Algorithm for Inner Product. IEEE Transactions on Computers, 17,
693-694.
Wisnik, J. M. (2014). O som e o sentido: uma outra hist ria das músicas. ão aulo:
Companhia das Letras.
Zangwill, Nick, Music and Aesthetic Reality: formalism and the limits of description,
Routledge, Oxford 2015
Zatorre, R., & Halpern, A. (2015). Music. Brain Mapping, 551-557. doi:10.1016/b978-0-12-
397025-1.00283-9
Zatorre, R., & Zald, D. (2011). Music. In Neurobiology of sensation and reward (Frontiers In
Neuroscience, pp. 405-428). CRC Press.
94
VI. Apêndice
A seguir, os resultados dos principais estudos encontrados na revisão sistemática
de literatura sobre o envolvimento de áreas cerebrais durante a escuta de música
considerada prazerosa:
Ano Autor Tarefa Método Resultados
2001 Blood et. Al Escuta passiva PET chills > controle:
striado ventral,
mesencéfalo,
amigdala, tálamo,
insula anterior,
cingulado anterior,
córtex orbito frontal
córtex e córtex pré-
frontal ventromedial
2004 Brown et al Escuta passiva
de música grega
não familiar,
mas considerada
prazerosa.
PET Agradável>
controle: 1º e 2º
córtices auditivos;
giro cingulado
subcaloso, divisão
afetiva do córtex
anterior, córtex
retrosplenial,
hipocampo, ínsula
anterior and núcleo
accumbens.
2005 Menon and Levitin Escuta passiva
de música
clássica em
contraste com
suas versões
alteradas
fMRI Foi detectada
conectividade entre
o núcleo accumbens,
a área tegmental
ventral e o
hipotálamo durante a
escuta de música
prazerosa.
2007 Miterschiffthaler et al Escuta passiva fMRI Música feliz >
Música Triste:
Giro temporal
superior esquerdo,
estriado ventral e
caudado.
2009 Schmidt and
Hanslmayr
EEG para
predizer o afeto
via estímulos
musicais através
da interpretação
do repouso
assimétrico das
ondas alfa no
córtex frontal
EEG ativações
assimétricas no
córtex pré-frontal
esquerdo e direito
em indivíduos que
relataram satisfação
e prazer na escuta
musical.
2009 Salimpoor et al Escuta passiva
de músicas
Medição de
dados
Correlação entre
prazer e excitação
95
preferidas psicofisiológicos emocional. Emoções
sentidas com grande
excitação poderiam
ser consideradas
gratificantes sem
recompense tangível.
2009 Osuch et. al Escuta passiva
de música
favorita e neutra
fMRI saudável >
deprimido: mOFC
esquerdo, Nac/VS
bilateral, mPFC
esquerdo. Não
prazeroso = Córtex
temporal medial e
globo pálido.
2010 Chapin et al Escuta passiva
de músicas com
variações
fMRI Treino musical> sem
treino: respostas
emocionais em
tempo real com
ativações do sistema
límbico e para-
límbico. A
recompensa e a
excitação dependiam
do treino musical,
bem como
facilitavam a
predição das
mudanças musicais
no tempo.
2011 Montag et al Escuta passiva
de música
favorita e
desagradável
fMRI Agradável>
desagradável:
ativação robusta do
Nacc, estriado
ventral, núcleo
caudado. Detectada
a importância da
antecipação.
Surpreendentemente:
participação da
insula na música
agradável, porque é
usualmente
relacionada ao afeto
negativo.
2011 Trost et al Escuta passiva
de músicas dos
4 últimos
séculos
fMRI Alta excitação de
emoção positiva:
estriado esquerdo e
ínsula / baixa
excitação e nostalgia
estriado direito e
COF/ alta excitação
e alegria: áreas
sensoriais e motoras
/ baixa excitação:
córtex ventromedial.
96
2011 Pereira et al Escuta passiva e
ranqueamento
fMRI Familiar = áreas
límbicas e
paralímbicas e o
sistema de
recompensa
Gostadas = córtex
cingulado e córtex
frontal, córtex motor
área de broca.
Familiaridade:
aumenta o
comprometimento
emocional do
ouvinte.
2011 Salimpoor et al Escuta passiva PET e fMRI Música prazerosa>
controle: pico de
dopamina no núcleo
accumbens.
2013 Bosch et al Escuta passiva 2 experimentos
com atividade
eletrodermal:1
com música não
familiar e outro
após o primeiro
contato.
Música familiar >
Música não familiar:
resposta
eletrodermal à
apreciação e ao
prazer.
2013 Perlovsky et al Escuta de
músicas
agradáveis e
desagradáveis
com tarefa
cognitiva de
questões
teóricas
Tarefa cognitiva
enquanto escuta
música agradável
e desagradável.
Música agradável >
música
desagradável:
valores mais altos
nas notas. Nos
resultados de
avaliação.
2013 Gold et al Tarefa de escuta
e aprendizagem
Tarefa de reforço
de aprendizagem
dependente de
dopamina.
Maior treino
musical: música
neutra para treino e é
melhor testado com
música prazerosa/
menor experiência
musical: treina
melhor com música
prazerosa e testa
melhor com música
neutra.
2014 Mantione et al Nenhum Estudo de Caso Paciente
desenvolveu um
repentino e distinto
gosto musical após a
estimulação do
núcleo accumbens.
2013 Salimpoor et al Escuta, tarefa
comportamental
e fMRI.
Ranquear as
músicas e dizer
fMRI - examinar
as respostas
neuronais a
músicas nunca
escutadas antes.
Músicas muito
desejadas> músicas
não desejadas: Giro
Temporal Superior,
NAcc, Ínsula.
97
quanto $ pagaria
por elas.
Estriado Dorsal,
Cerebelo.
Recompensa com a
música: interações
das vias
mesolímbicas e no
córtex auditivo e no
giro frontal inferior.
2014 Trost et al Tarefa de
atenção durante
a escuta ativa de
peças
consonantes e
dissonantes.
fMRI Música Consonante:
detecção de alvo
facilitada. fMRI:
ativações bilaterais
do núcleo caudado
em batidas fortes/
gânglios da base
detectavam o
processamento do
ritmo e o
processamento
emocional.
2015 Mueller K et al classificar o
estímulo
musical entre 1
e 4 (normal e
dissonante) em
várias versões
da música.
fMRI Fase inicial: estriado
ventral.
Processamento de
diferenças entre a
música para a frente
e para trás: o
hipocampo. Córtex
auditivo: versão
agradável.
2015 Chia-Wei Li et al Escutar 10
músicas
populares
FMRI -
Examinar os
correlatos neurais
nas 3 fases do
processo de
recompensa
Ganho de
recompensa e perda
de recompensa:
ativação do giro
tempoparietal
esquerdo e direito.
Antecipação de
recompensa: giro
tempoparietal
bilateral.
2015 Lawless and Vigeant Escuta passiva
em salas com
diferentes
reverberações.
fMRI Reverberação
moderada: salas
agradáveis acústicas
podem desencadear
recompensas de
antecipação em
indivíduos. 2
ativações positivas
sobre a recompensa
antecipatória.
2015 Trost et al Escuta passiva e
preenchimento
de questionário
fMRI – ISC Alta excitação:
sincronização da
ativação da amígdala
esquerda, ínsula
esquerda e núcleo
caudado direito.
98
Valência positiva:
diminui ativação na
amígdala e no
caudado.
2015 Mueller et al Escuta passiva
de músicas
instrumentais
agradáveis dos
últimos 4
séculos com
partes
manipuladas
fMRI Música prazerosa >
música
desagradável:
envolvimento do
núcleo accumbens,
estriado ventral e
amígdala.
2016 Patynem & LokkiMV Ouvir concertos
em salas
acústicas
distintas
Condução dermal A forma das salas de
concerto e suas
propriedades
acústicas afetam a
resposta emocional à
música e o prazer
sentido pelo ouvinte.
2016 Kantono et al Comer gelado
ao ouvir música
agradável e
desagradável
TDS Música agradável >
música
desagradável: maior
prazer enquanto
come-se gelado.