Diéresis y copiar y pegar

Tengo un problema con copiar y pegar caracteres como "ü". Cuando copio y pego el nombre "Gereon Müller" de este libro http://langsci-press.org/catalog/book/18 (seleccione la pestaña de descarga) obtengo la ü descompuesta en dos caracteres en una Mac. Esto no sucede bajo Windows y Linux (xpdf, acroread, sumatra), pero sí sucede en una mac con acroread y skim. ¿Algunas ideas?

Editar: Estos son los dos caracteres: ü En el texto puedes ver una ü, pero en realidad es una u con dos puntos que se desplazan sobre la u. Mira esto: ẗ (como puedes ver, compuse at con estos dos puntos). Esto no es un problema para leer la ü, pero si quiero seguir trabajando con esta ü tengo problemas, ya que a LaTeX no le gustan nada estos caracteres. En emacs puedo editar estos dos caracteres por separado.

Editar II:

Jugué con diferentes aplicaciones y se comportan de manera diferente: Word hace una copia y pega correctamente, mientras que Emacs hace ambas cosas mal.

Palabra:

Palabra

Emac:

emacs

Editar III

Y esta es la edición de texto:

ingrese la descripción de la imagen aquí

que 2 personajes y explicar la pasta a donde? que es "skim"
¿Qué pasa con el lector de PDF estándar "Vista previa" de Apple?
El problema también está presente con la vista previa.
Guau, nunca he visto a TextEdit hacer eso, y no puedo duplicarlo (copiar/pegar a Stefan Müller de la página x de ese libro con Vista previa y usando Minion Pro). Intente un arranque seguro (para reparar cachés posiblemente dañados) y vea si ayuda. support.apple.com/kb/PH14204
Intenté esto. Ningún cambio. ¿Puedo eliminar los cachés a través de la línea de comandos?
En TextEdit, si selecciona el texto y cambia la fuente a Lucida Grande, ¿ve el mismo problema?
Lo siento, acabo de darme cuenta de que Minion Pro era la fuente que funcionaba. Probé Lucida Grande y Helvetica y Times en los ejemplos que no funcionaron y nada cambió.
¿Puede enviarme una copia de su archivo TextEdit que contenga el texto que se muestra incorrectamente? Me gustaría investigar más a fondo (tom en bluesky dot org)

Respuestas (4)

Si tener dichos caracteres en forma descompuesta (representados por dos puntos de código, el carácter base más la combinación de acentos) es un problema para el procesamiento posterior que debe realizar, entonces puede usar una aplicación como Unicode Checker para convertir el texto a Unicode Normalization Form C. Eso los cambiará a la forma compuesta de un solo punto de código.

http://earthlingsoft.net/UnicodeChecker/

Reproduzco tus pasos:

El Libro está en inglés y en formato Adobe pdf.

Descargué la vista previa y encontré algunos ejemplos con "Umlauts".

Cópialas y pégalas en mis Notas.

Güldemann Joël König

Como puedes ver funciona perfectamente bien.

Le sugerimos que compruebe y actualice su Adobe Reader a la versión XI.

Todo el software está actualizado.
así que dinos dónde lo copias? tal vez ese sea el problema ya que funciona en mi MBA 10.9.2 con Adobe Reader XI.-¡Teclado alemán!
Copié/pegué una ü del texto en TextWrangler e hice un volcado hexadecimal y verifiqué que se representaba como dos caracteres, u más la combinación de diéresis. Esto normalmente debería mostrarse bien, a menos que haya un error en la fuente o la aplicación.
copiarlo en notas y ver si funciona allí
Lo copio y lo pego en word y en textedit y sale la ü como dos caracteres. Por extraño que parezca, puedo copiar otro ejemplo a word sin problemas, pero emacs lo odia. Publico capturas de pantalla en mi pregunta. Deshabilité todas las fuentes que instalé en mi fuente.
@Stefan: ¿Realmente viste la u y la diéresis por separado en TextEdit? ¿Qué fuente dijo TextEdit que estaba usando?
Sí, agregué una captura de pantalla. Dice Minion Pro.

"ü" casi siempre se representa como un solo carácter en los esquemas de codificación de texto, pero me han informado que también se puede representar como dos caracteres. En Unicode, por ejemplo, "ü" se representa como un único carácter "precompuesto" como 00FC. Sin embargo, existe como una agrupación de dos caracteres de uso menos común como 0075 0308.

Está encontrando un error extraño o una incompatibilidad. Sugiero que puede ser que el programa procesador de texto en el que está pegando el texto se haya configurado para ese documento, para usar un tipo de codificación de caracteres (antiguo y obsoleto) que no reconoce correctamente el carácter "ü". O eso, o hay algún problema extraño con la forma en que este PDF en particular con el que está trabajando ha sido codificado en caracteres.

Al inspeccionar el PDF al que se vinculó, veo lo siguiente:

Application: LaTeX with hyperref package
PDF Producer: xdvipdfmx (0.7.9)
PDF Version: 1.5 (Acrobat 6.x)

No entiendo las implicaciones de esto, ya que no tengo experiencia con LaTeX, pero quizás esto podría proporcionar una pista.

El siguiente paso para solucionar el problema es encontrar varios archivos PDF diferentes de diferentes fuentes y diferentes sitios web que también tengan alemán, y ver si obtienes el mismo resultado cuando copias texto de ellos y los pegas en cualquier procesador de texto que tengas. usando. Si no puede reproducir el problema, entonces es un problema con ese PDF en particular.

Luego, debe intentar pegar texto en alemán con diéresis de los diferentes PDF en nuevos documentos en blanco en diferentes programas de procesador de texto (Apple TextEdit, Bean, Apple Pages, Microsoft Word, OpenOffice, lo que tenga a mano) y ver qué resultados de eso. El problema podría ser una peculiaridad en un programa de procesamiento de textos en particular y su configuración de preferencias.

Te aseguro que es muy poco probable que tengas algún tipo de problema con el propio sistema operativo Mac OS X. Rutinariamente trabajo escribiendo texto y haciendo archivos PDF en varios idiomas con signos diacríticos, incluidos alemán, español, italiano y francés, y nunca me he encontrado con un problema como el que está informando.

OK, gracias, incorporaré su corrección en mi respuesta.

"Escriba caracteres alemanes - teclado alemán en línea", escriba su letra y cuando termine cópiela en el documento en el que la necesita (en mi caso, la copio a mi correo electrónico, no hay problema). Ese teclado en línea viene en muchos idiomas. Búscalo, es bueno, está en German.typeit.org

¿Dónde vota 0 negativamente "Escriba caracteres alemanes - teclado alemán en línea"?