Related Papers
Tradução automática, ma non troppo
Anabela Barreiro
This paper describes two machine translation tasks that require language expertise: (1) paraphrasing as a technique to prepare texts for translation and a method for linguistic quality assurance, and (2) the evaluation of translation produced by machine translation systems. These tasks will be exemplified through support verb constructions, a subtype of multiword units that machine translation systems have difficulty translating. The paper raises awareness of the need to integrate enhanced linguistic knowledge in machine translation systems and the need to place the human factor as a core value in order to ensure translation quality.
Oslo Studies in Language
Estudos de Terminologia no Brasil: diálogos com Portugal
Maria José B. Finatto
This paper contrasts some texts that deal with the history of the terminology research in Brazil, especially the research aimed to extract or recognize terminology in corpora, a widespread practice among us only from the year 2000, with pioneering texts on this topic produced by Portuguese researchers, represented here by Belinda Maia. The intention is to recognize her role as disseminator of the corpus-based methodologies. The paper follows showing how the dialogue between the Terminology studies from Brazil and Portugal is important for the promotion of Portuguese language in the global scenario of scientific and technical communication.
Oslo Studies in Language
Ensinador Paralelo: Alicerces para uma pedagogia nova
Diana Santos
After outlining some of Belinda Maia’s main ideas of how to use comparable corpora in translation teaching and learning, we present a new translator training tool: Ensinador Paralelo. It is an extension of Ensinador, originally developed for use with monolingual corpora (Simões & Santos 2011). This new tool produces exercises based on translations (previously done by pro- fessional translators or students, as we will see). In order to make the text more interesting to Belinda Maia we also study critically four translations of Lewis Carroll’s children books.
Oslo Studies in Language
A admiração à luz dos corpos
Diana Santos
This paper studies the field of admiração in their two meanings in Portuguese, namely: veneration/respect and surprise, using the framework suggested in Belinda Maia’s PhD thesis (Maia 1994/1996). After presenting briefly her findings and methodology, we investigate (i) the distribution of the vague words of the field of admiração by the two meanings, and discuss the heuristics used in its rule-based distinction; (ii) the distribution of admiração by genre, tense and person; (iii) its presence in negative sentences; and (iv) its antonym(s).
Oslo Studies in Language
Corpus-driven glossaries in translator training courses
2015 •
Stella Tagnin
A Linguística de Corpus tem-se mostrado um recurso valioso para a extração de candidatos a termos e unidades fraseológicas a partir de corpora especializados (Bowker & Pearson 2002). Na realidade, trata-se de uma abordagem relativamente nova já que a maioria dos glossários baseia-se, em geral, em material similar anteriormente existente. Embora haja muitos glossários no mercado, poucos foram compilados para atender às necessidades dos tradutores, cuja principal tarefa na tradução técnica é produzir um texto natural e fluente, seja na sua língua nativa, ou em uma língua estrangeira. Por essa razão, um glossário que consiste simplesmente de uma lista de termos e seus equivalentes não será satisfatório para o tradutor. Como produtores de texto, os tradutores precisam saber como a palavra é usada, ou seja, com quais palavras combina (Firth 1957; Sinclair 1991). Além disso, a linguagem técnica abriga termos que consistem de várias palavras assim como unidades fraseológicas ainda mais lon...
Linguamática
Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL ea sua avaliação
2010 •
Diana Santos
Resumo Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constituído por relações entre palavras, extraídas de forma automática de um dicionário da língua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações incluídas ea sua quantidade. Apresentamos também uma primeira avaliação, que tomou duas formas: para as relações ...
Calidoscópio
Um léxico de verbos do dizer para tradutores – e considerações sobre a classificação dos verbos de elocução
Cláudia Freitas
Global WordNet Conference
An overview of Portuguese WordNets
2016 •
Livy Real
Oslo Studies in Language
‘Ser’, ‘estar’, ‘ficar’, ‘haver’ e ‘ter’ contra ‘ha’, ‘bli’ e ‘være’: quem disse que era fácil traduzir sentimentos e sensações?
Diana Santos
It is well known that some kinds of expressions with so-called “have” and “be” verbs behave differently across languages, as is the case with Portuguese and Norwegian ‘tenho medo/pena’ (have) or ‘være redd/lei’ (be). But to what extent is this difference important for the translation of this class of verbs (given that there are a few that literally correspond to English ‘be’ and ‘have’, in the two languages)? In this paper I discuss what a corpus of (student) translations between Portuguese and Norwegian (PoNTE) can tell us about eight very frequent verbs (five Portuguese and three Norwegian), that range from auxiliaries to full lexical verbs,and which stand out as some of the most challenging ones to learn for foreign learners. After presenting an overview of their occurrence, in original and translated text, I go deeper into the functions of the Portuguese verbs by classifying every case in the source texts according to fifteen categories, thereby providing an interesting bird’s e...
Oslo Studies in Language
Automatic Anonymisation of a new Portuguese-English Parallel Corpus in the Legal-Financial Domain
Anabela Barreiro
Este artigo apresenta o processo de anonimização automática de entidades mencionadas num novo corpo paralelo pesquisável do domínio jurídico-financeiro para o par de línguas português-inglês. O corpo resulta de memórias de tradução utilizadas em tradução profissional. Contém cerca de 40.000 pares de frases alinhadas, ou seja, frases que são traduções umas das outras. A anotação das entidades mencionadas foi feita com regras especiais da Gramática de Restrições otimizadas para o domínio jurídico-financeiro, que permitiram alcançar uma abrangência balanceada em termos de precisão de quase 90% para as entidades mencionadas candidatas (pessoa, organização, endereço e identificadores pessoais) e uma abrangência consideravelmente superior com modificações heurísticas e otimizadas para a produção. O corpo destina-se a estudos de tradução e à linguística computacional (tradução automática estatística) e será publicamente pesquisável, permitindo ao seu utilizador procurar uma palavra ou expr...