文档出现乱码怎么回事?(文档为什么突然乱码了)
630
2022-05-29
一、版本控制
什么是“版本控制”? 版本控制是一种记录一个或若干文件内容变化,以便将来查阅特定版本修订情况的系统,对保存着软件源代码的文件作版本控制,但实际上,可以对任何类型的文件进行版本控制。
如果你是位图形或网页设计师,可能会需要保存某一幅图片或页面布局文件的所有修订版本(这或许是你非常渴望拥有的功能),采用版本控制系统(VCS)是个明智的选择。有了它你就可以将选定的文件回溯到之前的状态,甚至将整个项目都回退到过去某个时间点的状态,可以比较文件的变化细节,查出最后是谁修改了哪个地方,从而找出导致怪异问题出现的原因,又是谁在何时报告了某个功能缺陷等。
使用版本控制系统通常还意味着,就算乱来一气把整个项目中的文件改的改删的删,也照样可以轻松恢复到原先的样子,但额外增加的工作量却微乎其微。
许多人习惯用复制整个项目目录的方式来保存不同的版本,或许还会改名加上备份时间以示区别。这么做唯一的好处就是简单,但是特别容易犯错,有时候会混淆所在的工作目录,一不小心会写错文件或者覆盖意想外的文件。
为了解决这个问题,很久以前就开发了许多种本地版本控制系统,大多都是采用某种简单的数据库来记录文件的历次更新差异。
本地版本控制,最流行的一种叫做 RCS,现今许多计算机系统上都还看得到它的踪影。RCS 的工作原理是在硬盘上保存补丁集(补丁是指文件修订前后的变化);通过应用所有的补丁,可以重新计算出各个版本的文件内容。
接下来人们又遇到一个问题,如何让在不同系统上的开发者协同工作?于是,集中化的版本控制系统(Centralized Version Control Systems,简称 CVCS)应运而生。这类系统,诸如 CVS、Subversion 以及 Perforce 等,都有一个单一的集中管理的服务器,保存所有文件的修订版本,而协同工作的人们都通过客户端连到这台服务器,取出最新的文件或者提交更新。多年以来,这已成为版本控制系统的标准做法。
集中化的版本控制带来了许多好处,特别是相较于老式的本地 VCS 来说。现在,每个人都可以在一定程度上看到项目中的其他人正在做些什么,而管理员也可以轻松掌控每个开发者的权限,并且管理一个 CVCS 要远比在各个客户端上维护本地数据库来得轻松容易。
但是集中化的版本控制最显而易见的缺点是中央服务器的单点故障,如果宕机一小时,那么在这一小时内,谁都无法提交更新,也就无法协同工作;如果中心数据库所在的磁盘发生损坏,又没有做恰当备份,毫无疑问将丢失所有数据——包括项目的整个变更历史,只剩下人们在各自机器上保留的单独快照。本地版本控制系统也存在类似问题,只要整个项目的历史记录被保存在单一位置,就有丢失所有历史更新记录的风险。
分布式版本控制系统(Distributed Version Control System,简称 DVCS),在这类系统中,像 Git、Mercurial、Bazaar 以及 Darcs 等,客户端并不只提取最新版本的文件快照,而是把代码仓库完整地镜像下来,包括完整的历史记录。这么一来,任何一处协同工作用的服务器发生故障,事后都可以用任何一个镜像出来的本地仓库恢复。因为每一次的克隆操作,实际上都是一次对代码仓库的完整备份。
分布式版本控制更进一步,许多这类系统都可以指定和若干不同的远端代码仓库进行交互。因此,就可以在同一个项目中,分别和不同工作小组的人相互协作,可以根据需要设定不同的协作流程,比如层次模型式的工作流,而这在以前的集中式系统中是无法实现的。
二、Git 简史
同生活中的许多伟大事物一样,Git 诞生于一个极富纷争大举创新的年代,Linux 内核开源项目有着为数众多的参与者,绝大多数的 Linux 内核维护工作都花在了提交补丁和保存归档的繁琐事务上(1991-2002年间)。 到 2002 年,整个项目组开始启用一个专有的分布式版本控制系统 BitKeeper 来管理和维护代码。
到了 2005 年,开发 BitKeeper 的商业公司同 Linux 内核开源社区的合作关系结束,他们收回了 Linux 内核社区免费使用 BitKeeper 的权力,这就迫使 Linux 开源社区(特别是 Linux 的缔造者 Linus Torvalds)基于使用 BitKeeper 时的经验教训,开发出自己的版本系统。
他们对新的系统制订了若干目标:
速度;
简单的设计;
对非线性开发模式的强力支持(允许成千上万个并行开发的分支);
完全分布式;
有能力高效管理类似 Linux 内核一样的超大规模项目(速度和数据量)。
自诞生于 2005 年以来,Git 日臻成熟完善,在高度易用的同时,仍然保留着初期设定的目标。它的速度飞快,极其适合管理大项目,有着令人难以置信的非线性分支管理系统。
三、Git 是什么?
Git 和其它版本控制系统(包括 Subversion 和近似工具)的主要差别在于 Git 对待数据的方式。从概念上来说,其它大部分系统以文件变更列表的方式存储信息,这类系统(CVS、Subversion、Perforce、Bazaar 等) 将它们存储的信息看作是一组基本文件和每个文件随时间逐步累积的差异 (它们通常称作基于差异(delta-based) 的版本控制)。
存储每个文件与初始版本的差异,如下所示:
Git 不按照以上方式对待或保存数据,反之,Git 更像是把数据看作是对小型文件系统的一系列快照。在 Git 中,每当提交更新或保存项目状态时,它基本上就会对当时的全部文件创建一个快照并保存这个快照的索引。为了效率,如果文件没有修改,Git 不再重新存储该文件,而是只保留一个链接指向之前存储的文件。Git 对待数据更像是一个“快照流”。
存储项目随时间改变的快照:
这是 Git 与几乎所有其它版本控制系统的重要区别,因此 Git 重新考虑了以前每一代版本控制系统延续下来的诸多方面。Git 更像是一个小型的文件系统,提供了许多以此为基础构建的超强工具,而不只是一个简单的 VCS。
在 Git 中的绝大多数操作都只需要访问本地文件和资源,一般不需要来自网络上其它计算机的信息。如果习惯于所有操作都有网络延时开销的集中式版本控制系统,Git 在这方面会让你感到速度之神赐给了 Git 超凡的能量,因为在本地磁盘上就有项目的完整历史,所以大部分操作看起来瞬间完成。
举个例子,要浏览项目的历史,Git 不需外连到服务器去获取历史,然后再显示出来——它只需直接从本地数据库中读取,你能立即看到项目历史。如果你想查看当前版本与一个月前的版本之间引入的修改,Git 会查找到一个月前的文件做一次本地的差异计算,而不是由远程服务器处理或从远程服务器拉回旧版本文件再来本地处理。
这也意味着你在离线或者没有 VPN 时,几乎可以进行任何操作:
如你在飞机或火车上想做些工作,就能愉快地提交,直到有网络连接时再上传;
如你回家后 VPN 客户端不正常,那么也仍能工作。
使用其它系统的话,做到这些是不可能或很费力的。比如,用 Perforce 的话,没有连接服务器时几乎不能做什么事;而用 Subversion 和 CVS 的话,你能修改文件,但不能向数据库提交修改(因为你的本地数据库离线)。这样似乎问题不大,但是你可能会惊喜地发现它带来的巨大的不同。
Git 中所有的数据在存储前都计算校验和,然后以校验和来引用,这意味着不可能在 Git 不知情时更改任何文件内容或目录内容。这个功能建构在 Git 底层,是构成 Git 哲学不可或缺的部分,若你在传送过程中丢失信息或损坏文件,Git 就能发现。
Git 用以计算校验和的机制叫做 SHA-1 散列(hash,哈希),这是一个由 40 个十六进制字符(0-9 和 a-f)组成的字符串,基于 Git 中文件的内容或目录结构计算出来。SHA-1 哈希看起来是这样:
24b9da6552252987aa493b52f8696cd6d3b00373
1
Git 中使用这种哈希值的情况很多,你将经常看到这种哈希值。实际上,Git 数据库中保存的信息都是以文件内容的哈希值来索引,而不是文件名。
你执行的 Git 操作,几乎只往 Git 数据库中添加数据,你很难使用 Git 从数据库中删除数据,也就是说 Git 几乎不会执行任何可能导致文件不可恢复的操作。 同别的 VCS 一样,未提交更新时有可能丢失或弄乱修改的内容,但是一旦你提交快照到 Git 中,就难以再丢失数据,特别是如果你定期的推送数据库到其它仓库的话。
这使得我们使用 Git 成为一个安心愉悦的过程,因为我们深知可以尽情做各种尝试,而没有把事情弄糟的危险。
Git 有三种状态,你的文件可能处于其中之一: 已提交(committed)、已修改(modified) 和 已暂存(staged):
已修改表示修改了文件,但还没保存到数据库中;
已暂存表示对一个已修改文件的当前版本做了标记,使之包含在下次提交的快照中;
已提交表示数据已经安全地保存在本地数据库中。
这会让 Git 项目拥有三个阶段:工作区、暂存区以及 Git 目录:
工作区是对项目的某个版本独立提取出来的内容,这些从 Git 仓库的压缩数据库中提取出来的文件,放在磁盘上供你使用或修改;
暂存区是一个文件,保存了下次将要提交的文件列表信息,一般在 Git 仓库目录中,按照 Git 的术语叫做“索引”,不过一般说法还是叫“暂存区”;
Git 仓库目录是 Git 用来保存项目的元数据和对象数据库的地方,这是 Git 中最重要的部分,从其它计算机克隆仓库时,复制的就是这里的数据。
基本的 Git 工作流程如下:
在工作区中修改文件;
将你想要下次提交的更改选择性地暂存,这样只会将更改的部分添加到暂存区;
提交更新,找到暂存区的文件,将快照永久性存储到 Git 目录。
如果 Git 目录中保存着特定版本的文件,就属于已提交状态;如果文件已修改并放入暂存区,就属于已暂存状态;如果自上次检出后,作了修改但还没有放到暂存区域,就是已修改状态。
四、安装 Git
如果想在 Linux 上用二进制安装程序来安装基本的 Git 工具,可以使用发行版包含的基础软件包管理工具来安装。以 Fedora 为例,如果在使用它(或与之紧密相关的基于 RPM 的发行版,如 RHEL 或 CentOS),可以使用 dnf:
$ sudo dnf install git-all
1
如果在基于 Debian 的发行版上,如 Ubuntu,请使用 apt:
$ sudo apt install git-all
1
在 Mac 上安装 Git 有多种方式,最简单的方法是安装 Xcode Command Line Tools,Mavericks (10.9) 或更高版本的系统中,在 Terminal 里尝试首次运行 git 命令即可:
$ git --version
1
如果没有安装过命令行开发者工具,将会提示你安装。如果想安装更新的版本,可以使用二进制安装程序。官方维护的 macOS Git 安装程序可以在 Git 官方网站下载:Download for macOS。
在 Windows 上安装 Git 也有几种安装方法,官方版本可以在 Git 官方网站下载,打开 Downloading Git,下载会自动开始,要注意这是一个名为 Git for Windows 的项目(也叫做 msysGit),和 Git 是分别独立的项目。
要进行自动安装,可以使用 Git Chocolatey 包,注意 Chocolatey 包是由社区维护的。
另一个简单的方法是安装 GitHub Desktop,该安装程序包含图形化和命令行版本的 Git。它也能支持 Powershell,提供了稳定的凭证缓存和健全的换行设置。
有人觉得从源码安装 Git 更实用,因为能得到最新的版本。二进制安装程序倾向于有一些滞后,当然近几年 Git 已经成熟,这个差异不再显著。
如果想从源码安装 Git,需要安装 Git 依赖的库:autotools、curl、zlib、openssl、expat 和 libiconv。如果系统上有 dnf (如 Fedora)或者 apt(如基于 Debian 的系统),可以使用对应的命令来安装最少的依赖以便编译并安装 Git 的二进制版:
$ sudo dnf install dh-autoreconf curl-devel expat-devel gettext-devel \ openssl-devel perl-devel zlib-devel $ sudo apt-get install dh-autoreconf libcurl4-gnutls-dev libexpat1-dev \ gettext libz-dev libssl-dev
1
2
3
4
为了添加文档的多种格式(doc、html、info),需要以下附加的依赖:
$ sudo dnf install asciidoc xmlto docbook2X $ sudo apt-get install asciidoc xmlto docbook2x
1
2
如果使用基于 Debian 的发行版(Debian/Ubuntu/Ubuntu-derivatives),也需要 install-info 包:
$ sudo apt-get install install-info
1
如果你使用基于 RPM 的发行版(Fedora/RHEL/RHEL衍生版),你还需要 getopt 包 (它已经在基于 Debian 的发行版中预装了):
$ sudo dnf install getopt
1
此外,如果你使用 Fedora/RHEL/RHEL衍生版,那么你需要执行以下命令:
$ sudo ln -s /usr/bin/db2x_docbook2texi /usr/bin/docbook2x-texi
1
接着,编译并安装:
$ tar -zxf git-2.8.0.tar.gz $ cd git-2.8.0 $ make configure $ ./configure --prefix=/usr $ make all doc info $ sudo make install install-doc install-html install-info
1
2
3
4
5
6
完成后,你可以使用 Git 来获取 Git 的更新:
$ git clone git://git.kernel.org/pub/scm/git/git.git
1
五、初次运行 Git 前的配置
Git 自带一个 git config 的工具来帮助设置控制 Git 外观和行为的配置变量,这些变量存储在三个不同的位置:
/etc/gitconfig 文件: 包含系统上每一个用户及他们仓库的通用配置,如果在执行 git config 时带上 --system 选项,那么它就会读写该文件中的配置变量(由于它是系统配置文件,因此你需要管理员或超级用户权限来修改它);
~/.gitconfig 或 ~/.config/git/config 文件:只针对当前用户,可以传递 --global 选项让 Git 读写此文件,这会对系统上所有的仓库生效;
当前使用仓库的 Git 目录中的 config 文件(即 .git/config):针对该仓库,可以传递 --local 选项让 Git 强制读写此文件,虽然默认情况下用的就是它(当然,需要进入某个 Git 仓库中才能让该选项生效)。
每一个级别会覆盖上一级别的配置,所以 .git/config 的配置变量会覆盖 /etc/gitconfig 中的配置变量。
在 Windows 系统中,Git 会查找 $HOME 目录下(一般情况下是 C:\Users$USER )的 .gitconfig 文件。Git 同样也会寻找 /etc/gitconfig 文件,但只限于 MSys 的根目录下,即安装 Git 时所选的目标位置。如果你在 Windows 上使用 Git 2.x 以后的版本,那么还有一个系统级的配置文件,Windows XP 上在 C:\Documents and Settings\All Users\Application Data\Git\config ,Windows Vista 及更新的版本在 C:\ProgramData\Git\config,此文件只能以管理员权限通过 git config -f 来修改。
可以通过以下命令查看所有的配置以及它们所在的文件:
$ git config --list --show-origin
1
安装完 Git 之后,要做的第一件事就是设置你的用户名和邮件地址,这一点很重要,因为每一个 Git 提交都会使用这些信息,它们会写入到你的每一次提交中,不可更改:
$ git config --global user.name "Kody" $ git config --global user.email Kody@example.com
1
2
再次强调,如果使用了 --global 选项,那么该命令只需要运行一次,因为之后无论你在该系统上做任何事情,Git 都会使用那些信息。当你想针对特定项目使用不同的用户名称与邮件地址时,可以在那个项目目录下运行没有 --global 选项的命令来配置。
很多 GUI 工具都会在第一次运行时帮助你配置这些信息。
既然用户信息已经设置完毕,你可以配置默认文本编辑器了,当 Git 需要你输入信息时会调用它。如果未配置,Git 会使用操作系统默认的文本编辑器。
如果你想使用不同的文本编辑器,例如 Emacs,可以这样做:
$ git config --global core.editor emacs
1
在 Windows 系统上,如果你想要使用别的文本编辑器,那么必须指定可执行文件的完整路径。 它可能随你的编辑器的打包方式而不同。
对于 Notepad++,一个流行的代码编辑器来说,你可能想要使用 32 位的版本,因为在本书编写时 64 位的版本尚不支持所有的插件。如果你在使用 32 位的 Windows 系统,或在 64 位系统上使用 64 位的编辑器,那么你需要输入如下命令:
$ git config --global core.editor "'C:/Program Files/Notepad++/notepad++.exe' -multiInst -notabbar -nosession -noPlugin"
1
如果想要检查配置,可以使用 git config --list 命令来列出所有 Git 当时能找到的配置:
$ git config --list user.name=John Doe user.email=johndoe@example.com color.status=auto color.branch=auto color.interactive=auto color.diff=auto ...
1
2
3
4
5
6
7
8
你可能会看到重复的变量名,因为 Git 会从不同的文件中读取同一个配置(例如:/etc/gitconfig 与 ~/.gitconfig)。这种情况下,Git 会使用它找到的每一个变量的最后一个配置。
可以通过输入 git config :来检查 Git 的某一项配置;
$ git config user.name Kody
1
2
六、获取帮助
若你使用 Git 时需要获取帮助,有三种等价的方法可以找到 Git 命令的综合手册(manpage):
$ git help
1
2
3
要想获得 git config 命令的手册,执行:
$ git help config
1
此外,如果你不需要全面的手册,只需要可用选项的快速参考,那么可以用 -h 选项获得更简明的 “help” 输出:
$ git add -h usage: git add [
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Git
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。