UF
2 - Digitalitzación de textos
Los alfabetos del mundo. Tipologia
La comunicación, según Berelson, és:
<<La transmisión de información,
ideas, emociones, habilidades, etcétera, a través de símbolos, palabras,
imágenes, figuras, graficos, etcétera>>
Comunicación: darte a conocer a los
otros, mis:
Emociones
Sentimientos
Formas de pensar
situación en la cual me encuentro, etc.
Simbolos Signos
que permiten darme a entender con las otras personas que me envuelven mis emociones, sentimientos, formas de pensar, situación en la cual me encuentro etc.
Principios.
Comunicación gestual:
Gestos o símbolos hechos con el mismo
cuerpo.
Después
Un poco más adelante
comunicación gestual
+ sonidos(+complejos) (+información)
(+conocimientos)
Plasmación de señales, símbolos, signos
usados en la comunicación oral en paredes o piedras.
Por que? Simplemente por NECESIDAD (dar a
entender los otros lo que quería una persona)
Como lo hacen?
Recursos gràficos a mano: Un palo, una
piedra, los dedos, las uñas, un trozo de hueso del ultimo animal cazado….
Más endelante.
Lento refinamiento de las demandas y
necesidades: el mundo esta explicado por la MAGIA.
Un poco más adelante.
Necesidad y magia:
PRIMEROS SIGNOS DE ESCRITURA.
Escritura: Forma de darle un signo o
símbolo al lenguaje hablado.
Palabras: imitan sonidos de la
naturaleza, expresiones de la misma.
Lenguajes: a partir de los sonidos que
acompañan al gestos hechos por comunicarse.
Establecimiento de códigos consensuados
para poder completar el proceso comunicativo:
Emisor - Canal - Código - Mensaje -
Receptor.
CANAL - CÓDIGO
Medio físico - Lenguaje
Alfabeto: Agrupación de símbolos en un
orden determinación utilizada en el lenguaje escrito que sirve como sistema de
comunicación.
Deriva del número de las dos letras
griegas alfa 'y' beta '.
Los alfabetos del nombre (tipología)
Pueden clasificar los tipos de escritura
en dos grandes
A) escritura conceptual
A través de iconos o representaciones
gráficas expresa ideas o palabras.
Pictograma: Representación icónica que
puede ser realista o una idealización.
Ejemplos: Jeroglífico egipcio, hitita
jeroglífico
Escritura cuneiforme: Esta escritura
deforma progresivamente los pictogramas iniciales con una especie de punzón (en
latín cuneus '' cuña, cuña '') Ejemplo: sumerio
Ideograma: Elemento gráfico que
representa palabras.
Generalmente, antes era un pictograma.
Ejemplo: escritura china, ideogramas modernos; señales de tráfico.
B) escritura lingüística
A través de signos expresa sonidos.
Escritura silábica: Cada signo representa
un grupo fonético (sílaba). Ejemplos: Lineal B (griego micénico) silabario
hijita, silabario chipriota, entre las lenguas actuales, el japonés.
Escritura alfabética: Cada signo
representa un fonema (sonido) Ejemplos: Alfabeto fonético internacional (AFI)
No son escrituras perfectas, por ejemplo
en catalán: ss, sc ç representa /s/
h no representa ningún sonido
qu representa /k/ o /kw/
Origen de la escritura.
La escritura nace independientemente en
diversas civilizaciones, probablemente a partir de pictogramas.
Tiene como primer uso la contabilidad.
Hay diferentes investigadores que
defienden la influencia mesopotámica sobre la escritura egipcia i la china.
Mesopotamia: escritura suméria
A partir del 3300 ae. a Sumer se escribían
tablillas de arcilla con un sistema semipictográmico(20,000 ideogramas) que,
hacia el año 2500 ae, esdevé escritura cuneiforme.
La lengua numérica, poco conocida, és de
tipo aglutinante (ni indoeuropea ni semítica)
Orientación de la escritura: por columnas
(de izquierda a derecha) y de arriba a abajo.
Oriente medio y Ásia menor.
Adaptarán la técnica cuneiforme los
pueblos de el Oriente medio y Ásia menor: acida, elamitas, asirio, babilonios,
hurritas, hijitas.
Hacia al 500 ae, los persas emprenden un
nuevo sistema cuneiforme, de tipo silábico.
Egipto:
sistema jeroglífico
Des del 3000 ae hasta al 400 de, a Egipto
emplea el sistema jeroglífico (6.000 pictogramas), a partir del cual se
desenvolupan dos escrituras cursivas: demótica, hierática
La demótica o corriente, hacia el 650 ae,
más simplificada y para usos administrativos y económicos (silabario de 24
signos monoconsonánticos y 80 biconsonanticos)
La hierática o sagrada, gairebe tan
antigua como la sagrada, reservada des de la aparición de la demótica a la
religión.
China:
escritura logográfica.
Los primeros caracteres de la escritura
china (4.500 signos) ya aparecen a la dinastia Shang(1400 ae). Des de la
reforma de la dinastía Qin ( s. III ae) hasta al s. XX, cuando hay una derrera
simplificación y se introduce el alfabeto latín (año 1950) los caracteres
chinos augmentan hasta a 50.000, 1.500 de los cuales son apresos a la escuela
básica.
El origen pictográfico de algunos signos
es evidente, pero la escritura china ha esdevenido sobretodo semanticofonética
(logogramas)
Des del x. V, existen casos de escritura
silábica, el más regido de los cuales fue e
Japón.
A partir de los ‘’hanzi’’ o carácteres
chinos, los japoneses comenzaron a adaptar (s. V de), poco sistemáticamente y
con valor fonético, los kanji (5.000 signos, los cuales se aprenden unos 1.800
a la escuela)
Hasta el siglo IX no se desenvolupan los
dos silabarios principales.
Para la lengua oficial, el katakana o
kana( 47 signos derivados del k’ai-shu o escritura china, que ayudaban a
pronunciar los kanji)
Para la escritura corriente, el hiragana
(más de 300 signos, derivados del ts’ao-shu o cursiva china). Actualmente, al
japón, se emplea una escritura mixta y a menudo complicada, con kanji y
kana(motes extranjeros), hiragana (literatura. premsa, calle) y romaji(alfabeto
latín)
América
central
Los sistemas de escritura mas completos
de américa precolombina (los indios americanos hacian pictogramas y los incas
‘’quipus’’ o nusos) son:
El azteca (méxico cetral)
el maia (méxico meridional, guatemala,
honduras, el salvador)
todos dos sistemas combinan elementos
fonográficos y logográficos, hacen bien evidente después del desciframiento
casi total (85%) de los signos mayas.
Los primeros testimonios de escritura
centroamericanos són de 600 ae.
Creta:
escritura jeroglífica y silábica.
A creta s’empra una escritura jeroglífica
(1900-1700 ae) que evoluciona ninguna a dos cursivas:
Lineal A: (hasta 1450 ae): (80 signos) todavía
no descifrada, correspondía a la lengua minoica (no indoeuropea)
Lineal B: (hasta 1200 ae): (88 signos)
derivada de la lineal A, corresponde ya a una lengua griega (indoeuropea)
Todas dos son silábicas, todo y que hacen
servir logogramas, se escriben sobre tablillas de arcilla y su uso principal es
la contabilidad.
Escrituras alfabéticas
Las primeras escrituras alfabéticas registran lenguas semíticas:
a) evolucionan a partir de los jeroglíficos egipcios, como los:
-Inscripciones protosinaíticas (unos 31 signos)
-Protopalestinas (a partir del 1500 ae)
b) o bien evolucionan de la escritura cuneiforme, como los 30 signos del alfabeto d’Urgarito (Síria, 1500-1200 ae)
Alfabeto fenicio
El alfabeto fenicio también registra una lengua semítica.
Inscripciones más antiguas: 1200 ae (sarcófago del rey ahiram de biblos), pero las diferencias son insignificantes respecto al alfabeto establecido hacia el 1000 ae a Biblos: 22 signos consonánticos, orientados de derecha a izquierda
Origen: los vínculos culturales i comerciales de Fenicia con egipto, así como la estructura semítica común de sus lenguas, permitieron que el alfabeto fenicio fuera adaptado probablemente de la escritura egipcia
La palabra ‘’alfabeto’’ curiosamente proviene de los signos aleph y beth(son los nombres hebreos, por que no conservan los fenicios), que corresponden a las formas ‘’bou’’ y ‘’casa’’ de la escritura egipcia.
Derivados del alfabeto fenicio
Después de su establiment, la escritura fenícia se difundió oir el mediterráneo, por el oriente próximo y medio y llegó a la india, de manera que presenta las siguientes subdivisiones:
Rama fenicia
Rama palestina
Rama aramea
Árabe meridional (de donde deriva la escritura eliòpica 500 ae)
Alfabeto griego
El alfabeto semítico del alfabeto griego es indudable
La primera inscripción conocida es del siglo VIII ae, pero hay especialistas que avanzan l’adopció hacia 1000 ae.
El prestamo se había hecho de diversos lugares del mundo griego y evoluciona con el tiempo, así:
-griego arcaico: el nombre de letras es ariable y la orientación tiene la forma de bustrofedó
El griego classico: en cambio, encontramos un alfabeto (oriental de Milet o jònic) con 24 letras y una orientación izquierda/derecha
Innovaciones própias del griego:
Anotación de vocales(iregulares y esporádicas s las lenguas semíticas)
Destacar:
Aportación de vocales FUNDAMENTALES:
hace posible la transcripción fonética satistactoria de las lenguas europeas
primeras vocales:
Alfa, Epsilón, Iota(i), Omicrón, Ypsilón.
Destacar: b) periodo classico.
Las letras
Digamma, San, Qoppa, Sampi desaparecen
derivados del alfabeto griego
el alfabeto griego participará en el proceso de formacion de diversas escrituras:
En la época antigua: Lenguas no hel·leniques de ásia menor (cari, lici, lidi)
Las escrituras itálicas (etrusc)
el copte (egipcio y nubi)
en la epoca medieval
El gótico
L’eslau (ciril·lic)
Alfabeto latino
Es una de las numerosas escrituras que los etrusca y los itálicos toman, alfabetos griegos occidentales.
Roma, adaptación etrusca del esctriptura de Eubea
(> Cumas> Caere> Roma) VIII ae.
primeros testigos latinos datan del siglo VI ae.
Alfabeto clásico se constituye definitivamente 23 letras, orientación inicial bustrofédica. De izquierda a derecha.
De seres de una larga evolución (capital> semiuncial + uncial> carolina> humanística)
mas universales
Destacar:
a) principio 21 letras (G, J, N, O, Y = añadidas a nuestros alfabetos)
b) nuevos sonidos = nuevas combinaciones
CH, PH, RH, TH
Alfabeto arameo
pueblo semítico establecido en siria, se convirtió mercenarios y comerciantes
Adoptada de la fenicia, fue oficial durante más de un milenio a varios imperios y su lengua también se bíblica (escrita por evangelios)
22 consonantes y orientación derecha / izquierda
Alifbet hebreo
dos formas diferentes:
antigua: escritura fenicia, os religioso
moderna: alfabeto arameo, se llama hebreo cuadrado, empleada actualmente en israel. 22 consonantes
orientación derecha / izquierda.
Alif árabe
árabes constituyen como pueblo entre los siglos IX-VIII ae. pero no tienen un reino hasta el siglo I ae. (nabateos)
escritura árabe deriva del alfabeto arameu- nabateo que evolucionará en 2 tipos principales al periodo islammic
cúfica (monumental)
naskh (cursiva)
28 consonantes, signos vocálicos, orientación derecha / izquierda.
alfabeto adoptado en Asia, África y Europa para pobres no semítica (persa, afgano, malasio, bantúes)
Destacar:
no transcripción vocales cortas
No mayúsculas
no permite división a final de línea
consonantes dobles (tashdiid)
caligrafía árabe: arte en sí mismo (no permiten representar figuras animadas)
India
escritura protoíndica, corresponde a la civilización de Harappa y Mohenjorado (valle de El indo)
250 signos sin descifrar aún
Las escrituras modernas derivan del alfabeto arameo:
.la kharosti
.la brahmí: 32 signos consonánticos y 4 vocálicos orientación izquierda a derecha
gran variedad de escrituras locales a la india y asia central y tibet, entre los cuales sobresale la devanagari. (foto)
Alfabetos eslavos
fue una creación original de Cirilo como herramienta para la evangelización de los pueblos eslavos:
40 signos glagolítica
más reciente es el alfabeto cirílico
tiene 43 signos que derivan de letras griegas (24)
a partir del 1050 (separación de la iglesia romana y ortodoxa), los pueblos eslavos deben elegir entre el alfabeto cirílico y el latín.
Antes de llegar a los 30 signos actuales, el alfabeto ruso simplificó dos veces (siglo XVIII y siglo XX) alfabeto cirílico.
Escritura germánica
futhark o alfabeto rúnico, creación propia de los pueblos germánicos, con aportaciones del alfabeto latino
tenía entre 16 y 24 signos con forma lineal orientados de manera variable (derecha, izquierda, invertidos)
La etapa más rica: escombros encandinaves
caracteres rúnicos:
asociados a cuestiones mágicas y místicas.
los escombros transmiten un mensaje secreto.
cada signo tiene su calidad
'Maestros de las ruinas' gozan de prestigio.
Alfabeto ibérico
se utilizaron en la pnínsula ibérica varios alfabetos
.Fenici
.Grec Jónico
.l'escriptura tartésica-ibérica, se empleaba un sistema mixto, silábico y alfabético, de 27 signos.
.Orientació Dual (derecha / izquierda en el sur izquierda / derecha en el noreste)
pequeñas variantes fonéticas (diferenciación entre oclusivas sordas y sonoras en el noreste)
Actualmente se pueden leer, aunque no conocemos totalmente el significado de las palabras ni el origen de la lengua ibérica.
Nuevos alfabetos
taquigrafía (Pepys)
telégrafo (morse)
la escritura para ciegos (braille)
el IPA o Alfabeto Fonético Internacional (Passy)
Esperanto (lengua auxiliar planificada)
código de signos para sordos
señales de tránsito, etc ....
también han evolucionado:
la imprenta (china)
máquina de escribir
procesador electrónico de textos
Es una de las numerosas escrituras que los etrusca y los itálicos toman, alfabetos griegos occidentales.
Roma, adaptación etrusca del esctriptura de Eubea
(> Cumas> Caere> Roma) VIII ae.
primeros testigos latinos datan del siglo VI ae.
Alfabeto clásico se constituye definitivamente 23 letras, orientación inicial bustrofédica. De izquierda a derecha.
De seres de una larga evolución (capital> semiuncial + uncial> carolina> humanística)
mas universales
Destacar:
a) principio 21 letras (G, J, N, O, Y = añadidas a nuestros alfabetos)
b) nuevos sonidos = nuevas combinaciones
CH, PH, RH, TH
Alfabeto arameo
pueblo semítico establecido en siria, se convirtió mercenarios y comerciantes
Adoptada de la fenicia, fue oficial durante más de un milenio a varios imperios y su lengua también se bíblica (escrita por evangelios)
22 consonantes y orientación derecha / izquierda
Alifbet hebreo
dos formas diferentes:
antigua: escritura fenicia, os religioso
moderna: alfabeto arameo, se llama hebreo cuadrado, empleada actualmente en israel. 22 consonantes
orientación derecha / izquierda.
Alif árabe
árabes constituyen como pueblo entre los siglos IX-VIII ae. pero no tienen un reino hasta el siglo I ae. (nabateos)
escritura árabe deriva del alfabeto arameu- nabateo que evolucionará en 2 tipos principales al periodo islammic
cúfica (monumental)
naskh (cursiva)
28 consonantes, signos vocálicos, orientación derecha / izquierda.
alfabeto adoptado en Asia, África y Europa para pobres no semítica (persa, afgano, malasio, bantúes)
Destacar:
no transcripción vocales cortas
No mayúsculas
no permite división a final de línea
consonantes dobles (tashdiid)
caligrafía árabe: arte en sí mismo (no permiten representar figuras animadas)
India
escritura protoíndica, corresponde a la civilización de Harappa y Mohenjorado (valle de El indo)
250 signos sin descifrar aún
Las escrituras modernas derivan del alfabeto arameo:
.la kharosti
.la brahmí: 32 signos consonánticos y 4 vocálicos orientación izquierda a derecha
gran variedad de escrituras locales a la india y asia central y tibet, entre los cuales sobresale la devanagari. (foto)
Alfabetos eslavos
fue una creación original de Cirilo como herramienta para la evangelización de los pueblos eslavos:
40 signos glagolítica
más reciente es el alfabeto cirílico
tiene 43 signos que derivan de letras griegas (24)
a partir del 1050 (separación de la iglesia romana y ortodoxa), los pueblos eslavos deben elegir entre el alfabeto cirílico y el latín.
Antes de llegar a los 30 signos actuales, el alfabeto ruso simplificó dos veces (siglo XVIII y siglo XX) alfabeto cirílico.
Escritura germánica
futhark o alfabeto rúnico, creación propia de los pueblos germánicos, con aportaciones del alfabeto latino
tenía entre 16 y 24 signos con forma lineal orientados de manera variable (derecha, izquierda, invertidos)
La etapa más rica: escombros encandinaves
caracteres rúnicos:
asociados a cuestiones mágicas y místicas.
los escombros transmiten un mensaje secreto.
cada signo tiene su calidad
'Maestros de las ruinas' gozan de prestigio.
Alfabeto ibérico
se utilizaron en la pnínsula ibérica varios alfabetos
.Fenici
.Grec Jónico
.l'escriptura tartésica-ibérica, se empleaba un sistema mixto, silábico y alfabético, de 27 signos.
.Orientació Dual (derecha / izquierda en el sur izquierda / derecha en el noreste)
pequeñas variantes fonéticas (diferenciación entre oclusivas sordas y sonoras en el noreste)
Actualmente se pueden leer, aunque no conocemos totalmente el significado de las palabras ni el origen de la lengua ibérica.
Nuevos alfabetos
taquigrafía (Pepys)
telégrafo (morse)
la escritura para ciegos (braille)
el IPA o Alfabeto Fonético Internacional (Passy)
Esperanto (lengua auxiliar planificada)
código de signos para sordos
señales de tránsito, etc ....
también han evolucionado:
la imprenta (china)
máquina de escribir
procesador electrónico de textos
Tractamiento de textos.
a. composicion manual
b. metall fos
c. fotocomposición
d. tipografia digital /autoedición.
Composición manual.
cajones amb letras de plomo (tipografia)
Metall fos.
sistema que va tenir molt d’exit
compu gràfic (el nova mas)
originales de texto
manuscritos
hablados
analogicos (mecanografia)
impresos (diarios, revistas)
digitales (formatos digitales)
según el programario utilizado
MANUSCRITOS
escritos a mano, no son muy utilizados
hoy en día, muchas empresas lo rechazan por las dificultades y el coste
autores del campo de la literatura, los
entregan en ese formato
HABLADOS/AUDIO
otra opción mas extraña que la otra
el texto se presenta en formato audio, ya
sea analógico o digital, empresa de preimpresión se hace la conversión de
formato a medida que se escucha
estos originales pueden ser el motivo de
rechazo.
MECANOGRAFIADOS
en desuso.presentación gráfica desde hace
algunos años; se a relegado por la irrupción de la informatica, no hay cambios
de formato, se puede escanear. No presenta muchos problemas.
aun hay autores aferrados a esta forma de
trabajo
IMPRIMIDOS
originales que han estado imprimidos en
una anterior ocasión pero de los que no se dispone de tener copia original
caso habitual obras de dominio publico en
las obras publicadas en otros países de la misma área lingüística
DIGITALIZACIÓN
originales elaborados con un equipo
informático
ventajas sobre los demás originales en
actualidad, son los mas preferidos
problemas de los originales: van con
archivos
buenas especificaciones
se pueden presentar con un diferente
acabado
-originales digitalizados sin componer
-originales digitalizados medio
compuestos
-originales digitalizados compuestos
ORIGINALES DIGITALIZADOS SIN COMPONER
el autor se limita a escribir el texto
sin hacer distinciones
el autor pretende hacer fluir sus ideas
libremente
ORIGINALES DIGITALIZADOS MEDIO COMPUESTOS
el autor entrega el texto digitalizado
haciendo una propuesta de composición pero sin que sea la propuesta final
ayuda de la tecnologia informatica.
ORIGINALES DIGITALIZADOS COMPUESTOS
el original ya a estado tratado
correctamente por el autor y presenta todas las características que tiene que
presentar una vez impreso
el autor tiene que tener conocimientos de
composición.
ahorra mucho trabajo en la fase de
preimpresión, siempre que el trabajo esté bien realizado
PREPARACIÓN DE ORIGINALES
Especificaciones de entrega de originales
no digitalizados.
especificaciones; conjunto de normas
básicas que sirven de guía al autor para entregar su trabajo con unas mínimas
garantías y que permite a la empresa partir de una base sólida para su
posterior tratamiento.
el uso a propiciado su unificación de
estas normas, de tal manera que muchas de ellas son comunes para todas las
empresas del sector.
el autor entrega la copia del original y
nunca el original.
a) especificaciones de entrega de
originales manuscritos
presentarlos escritos por una sola cara
fundamental presentar una escritura
limpia, sin rayas ni esmeres,una generosa interlínea con un amplio margen,
fácilmente entendible para el trabajador encargado de la digitalización
formatos de papel, recomendable DIN A4.
utilizar papel blanco o de un color claro
para favorecer el contraste con la tinta empleada que en todo caso es negra o
de un color oscuro
presentar las paginas numeradas sobretodo
si el original presenta las hojas sueltas
si el autor quiere señalar alguna
corrección en este original la tiene que hacer con otro color de tinta.
b) especificaciones de entrega de
originales hablados
presentarlo en un sistema de archivo
normalizado (analógico: cinta k7. digital: mp3, flv..)
dicción clara y audible, dócilmente
entendible para el trabajador encargado de la digitalización
c) especificaciones de entrega de
originales mecanografiados
escritos por una sola cara
hacen servir un formato de papel estándar
(DIN A4: 21 x 29,7)
el blanco de los márgenes tiene que ser
amplio (amenos dos centímetros) y tienen que ser mas grandes los márgenes de
cabeza a pies.
blanco de la interlínea también tiene que
ser generoso (a doble espacio)
tiene que aparecer el numero de pagina al
frente y marginado a la derecha
tiene que aplicarse una sangría de un
tabulador a la primera línea de cada parágrafo
texto se presentará sin justificar,
margen a la izquierda.
el autor no debe incluir correcciones del
original. dificultaría la digitalización mediante OCR(optical character
reconnection)
el original ha de presentarse sin rayas
ni esmenes y con grafismos bien contrastados para facilitar la digitalización
d) especificaciones de entrega de
originales impresos
tiene que existir un buen contraste entre
el color de texto y el fondo, sin transparencias que entorpezcan la
digitalización.
algunas fuentes pueden causar problemas
en la digitalización, se hace una prueba previa.
se comprueba que el original se adapte al
escáner, que el libro se abra completamente y que el formato sea mas pequeño
que el área de escaneado.
Especificaciones de entrega de originales
digitalizados
a) especificaciones relativos a
aplicaciones y formatos
se tiene que entregar SIEMPRE:
una copia impresa escrita por una sola
cara con:
el numero de pagina de la ultima version
entregada
el listado de archivos con la extension
correspondiente
l’aplicación o aplicaciones con las que
se a creado
su versión
entorno operativo
aplicaciones comúnmente aceptadas:
editor de textos de sistemas operativos:
Simple Text, Text Edit.
editor de textos profesionales: Word,
WordPerfect.
maquetación: (QuarkXPress, Pagemaker,
Ventura Publisher, InDesign)
el autor tiene que consultar previamente
con el preimpresor.
recomendable que cada parte del trabajo
se guarde en un archivo independiente.
para que los archivos se dispongan de un
orden, tienen que numerarse con ceros y decenas(y en las centenas si el trabajo
lo requiere)
a) especificaciones relativas al texto
configuración de página estándar.
El blanco de los márgenes ha de ser
amplio amenos dos centímetros
El blanco de interlinea también tiene que
ser amplio (doble espacio)
Tiene que aparecer el numero de pagina y
margen a la derecha
son preferibles originales sin componer,
a no ser que el autor quiera componerlo, tenga los conocimientos adecuados y no
lo haya consultado previamente, con la empresa de preimpresión
el texto es presentara alineado a la
izquierda, sin justificar y sin partición de palabras
No se tiene que forzar el cambio de linea
ni el cambio de pagina
Tipo de letra lo más estándar posible
Las notas se tienen que incluir en el
lugar que irán ubicadas, separadas del texto general por guiones largos.
Tablas y cuadros se tienen que componer
en un documento a parte y adjuntarlo como archivo independiente.
Se aplica un sagnat de un tabulador a la
primera linea de cada párrafo
Los párrafos no se tienen que separar
entre si por lineas en blanco
Periféricos de entrada
Equipos informáticos tienen que estar
conectados a escáners y disponer amenos de una aplicación de reconocimiento
óptico de caracteres OCR.
que permitan la digitalización de
originales mecanografiados o aquellos originales que están imprimidos.
deben de disponer de conexión externa y
interna por medios de comunicación.
un fax puede complementar el envío de los
originales.
Ordenadores.
Compatibles IBM (PC) y Macintosh (Mac)
los 2 entornos son necesarios en la
actualidad en una empresa de preimpresión y también en el proceso de recepción
de originales, los archivos digitales pueden provenir de dos entornos.
en la actualidad son compatibles y por
eso es posible compartir archivo entre ellos; puede ser fuente de problemas por
lo que es recomendable hacerlo en el entorno adecuado.
Fuentes.
La información sobre las descripciones de
fuentes se recogen en pequeños archivos.
Aplicaciones.
Las aplicaciones de edicion básica
propias de cada sistema operativo son suficientes para preparar originales
digitales y los formatos en que permiten guardar los documentos.
Formatos digitales de archivos de texto.
FORMATOS ABIERTOS
-ASCII: (American Standard Code for Information Interchange) no contiene información de tipografía o diseño
-RTF: (Rich Text Format) Contiene información de tipografía o diseño muy básica
FORMATOS ESPECÍFICOS
-Procesador de textos (InDesign por ejemplo)
+ Contienen toda la información de tipografía o diseño
+permiten exportar en EPS poscript
Tipografia
-Poscript :archivo primordial, se necesitan 2 archivos, 1para la tipografia y 2 para imprimir.
-TrueType: necesita 1 archivo
-OpenType: Tipografia abierta
creación tipográfica
a. Profesional = fundición digital
b. Autor = aplicación especializada
Aplicaciones de creación tipografica
fontlab, fontcreator
tipografia digital
Fuentes bitmap = herencia matrices fotocomposición (inicios) problemas de resolución en la salida
Fuentes vectoriales= arquitectura genuinamente digital (actualmente) No depende de resolución
Fuentes vectoriales
Formas definidas mediante lineas y curvas.
-Impresión independiente de la resolución del dispositivo de salida -> Fuentes escalables.
-representación en pantalla (bitmap de pixeles) mediante la técnica antialiasing (suavizar limites, incluido otorgando grises)
a. extension ATM (Adobe Type Manager)
b. Sistema operativo
Tipografia digital
Postscript 1 (PS1)
True Type (TT)
Postscript 1 (PS1) : Definidas por curvas Bézier (nodos y puntos de control)
Primera tecnologia de fuente vectorial, no portable completamente, versiones diferentes para Mac y Win
Compuesta por 2 ficheros.
1. Fichero vectorial - impresión
2. Maleta de ficheros bitmap - pantalla
1. Fichero vectorial
2. Fuente de pantalla
a. MAC - Maleta de fuentes con dos o mas tamaños (innecesaria con ATM)
b.WIN - sin maleta
MAC
1. Fuente de pantalla = .bmap
(implementa los datos métricos = anchura de caracteres y parejos de kern)
2.Fuente de impresión = sin extensión (en tipo profesional Adobe, AGFA…)
-Definición del contorneo de la fuente por impresora
WINDOWS
1. Fuente de impresión = .pfb
-Definición del contorneo de la fuente por impresora
2. Archivo de información métrica = .afm /.pfm
-Información utilizada para componer la fuente, incluyendo dimensiones de carácter y espaciado entre caracteres
- Ocasionalmente =.inf - archivo de texto con nombre de fuente y otros datos
Fuente de pantalla
-Juego de caracteres bitmap
(10,12,14,16,18 y 24 pt)
-ampliación= fuente escalonada (llevado con ATM)
-Diferentes series por fuente (bold, cursiva, regular….)
-Vinculación fuente de pantalla con outline font
(garantiza que sèrie escogida será la impresora)
TrueType (TTf) = definidas por ‘’splins’’ (funciones de programación)
Desenvolupa Apple (finales 80) para competir con PS1
portable completamente (multiplataforma)
-Compuesta por un fichero único (vectorial)
.extensión .suit o .tt
(anteriormente) se acompañaba de maleta de tipos para acelerar la visualización en pantalla
PS1 vs. TT
PS1 rasterizado optimo - mismo LDP (Ps)
Aceptada para todos los dispositivos Ps
Fuente de trabajo para todas las factorías
TT
Mayor versatilidad multiplataforma (PC)
Fichero único
Rasterizado mas lento -> conversión a PS
-No aceptada para todos los disposiivos PS
Mejor hinting -> mayor peso en memoria
2048x2048 vs. 1000x1000)
Multiple master (MMf)
Desenvolupamiento de PS1 realizado por Adobe.
Actualmente abandonada por Adobe pel
Desenvolupamiento d’OTF
Basado en Unicode -> doble byte (65.000 caracteres)
cada fuente adopta forma diferente sin distorsión
- solo funciona con utilidad ATM
OpenType (OTF)
Desenvolupamiento Adobe y Microsoft, adoptada para apple
Basado en Unicode -> doble byte (65.000 caracteres)
conjunto de caracteres expandido y opciones tipográficas avanzadas
Archivo único -> fuente autocontenida
total compatibilidad con fuentes TTf y PS1
Fuente inteligente -> elige para cada situación tipográfica la variación optima
------------------------------------------------------------------------------------------------------------
DIGITALIZACION DE LOS ORIGINALES:
-Cuando se a recibido hay que comprobar que cumple con las especificaciones de la entrega, que es adecuada en relación con las pautas marcadas a l’orden del trabajo, se tiene que hacer una copia del trabajo, se a de recoger la operativa de este proceso en los ficheros correspondientes…
Procedimiento general:
1) Se enciende en equipo y se comprueba que es el adecuado para realizar el trabajo.
2) Que tenga instaladas y operativas las aplicaciones que van a utilizarse y las fuentes necesarias.
3) Que el entorno del trabajo es el mas adecuado para el que hace condiciones de luz, ruido ambiental, etc.
4) Se pone la copia del original convenientemente en un atril o elemento auxiliar similar que permita su correcta visión.
5) Los originales en audio se hacen necesarios un equipo de reproducción e audio.
6) Abrir la aplicación
7) Se entera un documento de trabajo asignado a l’archivo resultando un nombre conveniente, teniendo en cuenta las especificaciones recogidas en el orden de trabajo.
ORIGINALES NO DIGITALES:
Manuscrito:
-Se hacen necesario una lectura atenta para evitar errores de interpretación.
-La peculiaridad del formato de presentación es recomendable que el teclista que esta digitalizado el texto tenga la posibilidad de acceder directamente a el autor y aclarar posibles dudas.
-Si es posible a de ser el propio autor quien a modo de escuchar lee el original porque el teclista lo escriba el texto con mas garantías.
Hablados:
-Es necessario una audición atenta.
-Igual que en el caso anterior es recomendable el acesso directo del teclista con el autor.
-Esta modalidad de originales hace necesario picar el texto primero sin realizar la interpretación de los originales.
ORIGINALES DIGITALIZADOS:
Originales en formato digital:
-En la recepción de los originales ya se a determinado previamente en el proceso de recepción de originales si el formato en que es presenta el original es compatible con los equipos disponibles a la empresa y si se requiere conversión de formato.
Originales digitalizados sin componer:
-En este caso se cambia el formato sin proceder.
Originales digitalizados medio compuestos:
-Se aprovecha el formato sin procede.
ESTABLECIMIENTOS DE LOS PARÁMETROS TIPOGRÁFICOS:
-Consiste en determinar y marcar sobre la copia del trabajo o mejorar en una ficha de especificaciones tipográficas la forma en que han de disponerse los textos y otros elementos complementarios de la obra, de tal manera que esta señalización sirve de referencia para conformar el texto.
-Este proceso se realiza una vez que se ha digitalizado los originales y se han de obtener copias impresas del trabajo sin compaginar.
-Previamente o el mismo tiempo que se establezca los parámetros tipográficos, se realiza la corrección de las galeras, donde se introducen las modalidades.
-Esta tarea la habría de hacer el autor al lado de los correctores correspondientes.
-Generalmente esta especificación tiene que aparecer en un sitio visible y lógico.
-Las especificaciones generales se presentan a la primera pagina de la copia del trabajo.
1.TEXTO GENERAL:
-Es aquella que predomina el texto, expone las ideas principales y es el cuerpo de la obra.
-Sus características principales es la legible.
-A de facilitar la lectura porque al lector le sea inteligible.
-Esta condiciones han de permanecer sobre otras.
OCR
L’OCR
aplicación común de los escáneres
OCR = Optical character recognition
programa que lee imágenes digitales, busca conjuntos de puntos que se parezcan a letras.
complejidad de este programa, entenderá + o - tipos de letras, derivando escritura manual, podemos mantener el formato original de un texto, aplicar reglas gramaticales.
el programa puede confundirse de caracteres ‘’t’’ y ‘’1’’
Gran resolución 300 ppp para textos o 600 ppp si se trata de un tipo de letra pequeña u original de poca calidad como los diarios
podemos ahorrar el aspecto del color, será suficiente con blanco y negro (1 bit por color) o como máximo una escala de 256 grises (8 bits)
por este motivo algunos escáneres els hi manca soporte para el color. Se escanean los puntos que las forman, una especie de fotografía de texto. es un texto modificable.
L’OCR: optimización de recursos.
Ultimos años, la digitalización de textos se convirtió en un punto de interés para la sociedad
Se generaban continuamente grandes cantidades de información escrita, tipográfica….
poder automatizar la introducción de carácteres evitando la entrada para teclado, implica un importante ahorro de recursos humanos y aumento de productividad.
RECONOCIMIENTO OPTICO DE CARACTERES (OCR)
identifican automaticamente símbolos.
dispositivo que obtiene la imagen puede introducir niveles de grises
La resolución puede introducir ruido a la imagen, afectado los pixeles.
Separación de los caracteres. pueden producirse errores.
Conexión de dos o mas caracteres por pixeles comunes también puede producir errores.
ESQUEMA BÁSICO DE UN ALGORISMO DE RECONOCIMIENTO OPTICO DE CARÁCTERES.
4 pasos
1. Binarización: dos colores, forma de hacerlo mediante histograma de la imagen, para binarizar tendremos que elegir un llindar adecuado. los pixeles que no lo superen(negro) la resta en blanco. Obtenemos una imagen en blanco y negro, quedan marcados los contornos. Podemos aullar las partes de la imagen que contienen texto.
2. Fragmentación o segmentación de la imagen: proceso mas costoso y necesario. La segmentación implica la detención mediante procedimientos de etiquetado determinista(orden determinado) o estocástico(no hay un orden determinado). Permite la descomposición de un texto, suficientemente invariables, para ser independientes del escritor, y suficientemente significativas en su reconocimiento. no existe un método genérico para llevar a cabo esta segmentación.
Técnicas mas utilizadas son variaciones de métodos basados en proyecciones lineales
clusters
3. Simplificación de los componentes: Aplicar un proceso de simplificación por cada una de ellas.
Consiste en ir borrando los puntos de los contornos de cada componente, de forma que se reserve su tipología. Esborrado en paralelo, señala los pixeles boreales para eliminarlos todos a la vez, clasificación y reconocimiento simplificando la forma de los componentes.
4. Comparación con patrones: caracteres obtenidos anteriormente
comparación con diferentes patrones, diferentes métodos: método proyección(vertical y horizontal)
OCR: APLICACIONES.
aparición algorismos para aumentar el rendimiento de sus servicios
Aplicaciones destacadas que se utilizan en OCR:
Reconocimiento de textos manuscritos
dificultades que nos podemos encontrar a la hora de reconocer un texto tipografiado, no se pueden comparar a la hora de reconocer un manuscrito, manuscrito todavía sigue siendo un desafío.
La mayoría de algoritmos OCR no consiguen buenos resultados ya que la segmentación de texto continua siendo un procedimiento complejo, se puede llegar a entender una frase cuando la hemos acabado de leer.
operación de nivel morfológico, léxico y sintáctico. Para conseguir esta metodología se utilizan algoritmos robustos que no utilizan segmentación previa.
Reconocimiento de matrículas.
aplicación mas clara, reconocimiento de matrículas utilizado en los radares. capaces de localizar la matricula de un vehículo con condiciones de iluminación, perspectiva y entorno variable. en la etapa de segmentación, se buscan texturas similares a la de una matrícula y se aísla la área rectangular que la forma. se aplica un proceso de clasificación múltiple sobre el conjunto de pixeles, pertenecen a la matrícula. Si aparece algún error, se corrige.
Indexación en bases de datos
gran aumento de información publicada,cada vez son mas los métodos que se utilizaban para organizar todo estos materiales almacenados en bases de datos. Uno de estos contenidos son imágenes. formas mas corrientes de buscar imágenes es a partir de las metadatos(ocultos en cada imagen) introducidos manualmente por los usuarios. Han aparecido buscadores que proporcionan la posibilidad de buscar imágenes mediante el texto que aparecen en ellos, buscador DIRS (Document Image Retrieval System) mediante un algoritmo de reconocimiento óptico de caracteres.
esta tecnología proporciona posibilidad de buscar imágenes y demuestra que OCR todavía puede dar mas de sí.
No hay comentarios:
Publicar un comentario