versiones usados source software sistemas sistema que para open mas informatica fuente ejemplos documentos control codigo svn mercurial ms-word

usados - Control de versión svn o mercurial de documentos word



sistemas de control de versiones mas usados (7)

Hasta donde yo sé, Microsoft recurrió a una especie de representación basada en xml en su versión más reciente de la oficina. Si eso es realmente cierto, entonces asumiría que el control de versiones funcionaría, aunque obviamente tendrías que resolver cualquier cambio integrado con el anterior

<<<<<< ====== >>>>>>

marcas en ellos antes de cargar la palabra.

Esta otra pregunta menciona el problema, pero parece tomarse como una conclusión inevitable de que el control de versiones simplemente no funcionará en Word, y quiero saber por qué?

¿Es el control de versión (es decir, Subversion) aplicable en el seguimiento de documentos?


La conclusión inevitable es que, si bien la mayoría de los sistemas de control de versiones, si no todos, Mercurial incluido, sí funcionan con archivos binarios, apestan por diferirlos y fusionarlos.

Los archivos de Word son de naturaleza binaria. Sí, las últimas encarnaciones de Office cambiaron al formato "Office Open XML", que incluye XML, pero todavía envuelven todo en un archivo zip, lo que significa que todavía es binario (y sí, sé que todos los archivos están en hecho binario, ya sabes a qué me refiero).

Ahora, a muchos sistemas de control de versiones, tanto Mercurial como Subversion, se les puede decir cómo fusionar cualquier tipo de archivo que considere binario dándole una herramienta de fusión externa que pueda hacer el trabajo.

Esto básicamente significa que si puede encontrar un programa que puede tomar dos archivos de Word, diferirlos y permitirle conciliar las diferencias, entonces está en el negocio.

Si descomprimió el archivo de Word y versionó los contenidos, entonces sí, podría obtener conflictos de combinación que puede resolver a través de Mercurial, sin embargo, el contenido aún estaría en un formato que usted no escribió, por lo que la conciliación de conflictos difíciles de combinación podría no será solo difícil, podrían ser imposibles.

En resumen, los sistemas de control de versiones se destacan en el almacenamiento de archivos binarios, pero apestan al diferirlos y fusionarlos .

Si nunca necesita hacer diff o merge, puede usar Mercurial o Subversion o lo que sea, y funcionará muy bien.


Depende de la configuración.

Si se trata de un documento de corta duración del que desea realizar un seguimiento de los cambios, utilice el control interno de Word.

De lo contrario, use SVN o Sharepoint o algún otro medio externo para grabar documentos versionados. Si no lo hace, corre el riesgo de que alguien sobrescriba el archivo con toda la información de versiones perdida.


Existe la extensión zipdoc para Mercurial, que parece manejar archivos comprimidos, como documentos Word basados ​​en XML, almacenándolos sin comprimir internamente para obtener deltas significativos y fusionarlos de una manera significativa. No lo probé, pero suena como lo que estás buscando.


Los nuevos formatos están de hecho basados ​​en XML, sin embargo, el archivo .docx en sí es en realidad un archivo zip. Entonces, en última instancia, sigue siendo un archivo binario ...


Supongo que depende de quién usará los documentos. Por lo general, solo los desarrolladores se sienten cómodos con el uso de VCS, por lo que puede estar complicando las vidas de las personas que solo desean acceder a través de una unidad compartida.

Por otro lado, el historial de revisión a menudo es muy importante, y a menudo veo documentos de Word con grandes resúmenes en la parte superior, enumerando todos los cambios, lo que parece realmente tonto.

Creo que las soluciones basadas en la nube, como los documentos de Google, probablemente llenen este vacío en el futuro. O tal vez solo una wiki de equipo. En general, está intercambiando algunas de las características de palabras más elegantes para tener una experiencia de intercambio más abierta, pero los documentos de Google se están volviendo bastante poderosos.


Pondría el caso de uso en primer plano. Mucha gente en el mundo necesita herramientas para comparar dos versiones del mismo documento de Word, pero no son desarrolladores, sino, por ejemplo, abogados. En mi firma de abogados clientes, los documentos se envían a sus clientes y vuelven con ediciones, por lo que una comparación basada en documentos es absolutamente necesaria. Utilizan la función de comparación de palabras incorporada o herramientas de terceros (WorkShare DeltaView es algo así como un estándar de la industria). Estas herramientas también permiten comparar documentos PDF.

El caso de uso aquí está claramente orientado al contenido: los abogados necesitan obtener rápidamente una visión general de las diferencias entre dos versiones de un contrato. Ambas versiones pueden almacenarse en un sistema de gestión de documentos como "versiones", o en el caso de DeltaView, el archivo delta puede almacenarse para una revisión posterior.

¿Cuál puede ser el caso de uso para un desarrollador? Los sistemas de control de fuente significan control "SOURCE", y no "controlan todo lo que viene en mi proyecto". Prefiero almacenar documentos relacionados con el proyecto (Planes, Especificaciones, Requisitos, Correos electrónicos) en otra tienda, no en Mercurial. - Por otro lado, uso a menudo documentos de Word o plantillas de Word como parte de la solución en los proyectos de Document Template, y por supuesto estos documentos son fuente, por lo que se guardan en el repositorio. Pero la necesidad de visualizar las diferencias era hasta ahora relativamente pequeña, especialmente si sus comentarios son buenos ("Versión 1 - init", "Versión 2: cuadro de texto agregado en el encabezado", "Versión 3: información adicional del pie de página", etc.).


Respuestas a varios puntos o suposiciones leídos aquí:

  • Sí, subversion hace un muy buen trabajo al diferenciar archivos binarios . Por ejemplo, 60 versiones de un archivo de 30Mb toman 90Mb para uno de mis documentos con muchas fotos.
  • Sí, Tortoise SVN llama automáticamente a la diferencia de MSWord nativa y, por lo tanto, le permite ver las diferencias exactas (incluidos los formatos) entre dos versiones, a nivel de personaje.
  • Considere utilizar las características de Cambios de seguimiento de la palabra en lugar de una comparación posterior , esto también hará un seguimiento de los movimientos, mantendrá a los autores, etc. Contesta las diferentes necesidades ...
  • Sí, un archivo docx es un directorio comprimido con archivos xml. Intente, simplemente abra un archivo docx con una utilidad zip o descomprímalo.
  • Considere guardar en XML en lugar de docx, si desea la expansión de palabras clave:

  • Guarde su archivo como .xml en lugar de .docx; aunque su archivo es mucho más grande (ya no está comprimido), puede ahorrar espacio con la compresión svn, más eficiente en el texto que los binarios, supongo.

  • Inserte sus palabras clave snv (por ejemplo, $ Rev $) en las propiedades del documento de Word (usando Información de archivo, Propiedades en el panel derecho)
  • Muestre la información en su documento usando los campos: Isert-Quick Parts-Document Property, por ejemplo

Eso parece funcionar para mí.

Rodolphe