首先,我要承認(rèn)我很土。
這段時(shí)間OOXML因?yàn)槭欠窠邮転闃?biāo)準(zhǔn)的問題,大家討論的沸沸揚(yáng)揚(yáng),在cnBeta上,不時(shí)看到倪光南老先生 出來balabala...,最近因?yàn)橐鯡xcel相關(guān)的東西,也開始對(duì)這個(gè)新的文檔格式感興趣,可是好長(zhǎng)一段時(shí)間我都不知道OOXML是個(gè)什么東東? (我很土,我想在Excel 2007的另存格式列表中找到OOXML格式,表笑我啊)
Google之,ft,Wikipedia無(wú)法訪問。百度之,在百度百科找到這樣的解釋:
OOXML全稱是office Open XML,OOXML是由微軟公司為Office 2007產(chǎn)品開發(fā)的技術(shù)規(guī)范,現(xiàn)已成為國(guó)際文檔格式標(biāo)準(zhǔn),兼容前國(guó)際標(biāo)準(zhǔn)ODF(Open Document Format)和中國(guó)文檔標(biāo)準(zhǔn)UOF(Unified Office document Format)。
O M G!這也太官方了,看得我云里霧里。于是繼續(xù)換到Google,Search,皇天不負(fù)有心人啊,終于找到這篇文章,The New Excel 2007 File Format,終于是撥開云霧見月明。
現(xiàn)在按照我土人的理解,用土話來解釋OOXML就是:所 有的Office 2007的默認(rèn)文檔格式(docx, xlsm等)的文件,都是一個(gè)zip壓縮文件(不再是之前的二進(jìn)制文件),其中包含的是多個(gè)xml文件和媒體資源文件等(比如word中插入的圖片)。而 所謂的OOXML標(biāo)準(zhǔn),我的理解,就是定義如何用這些xml文件來表示Office文件。
下面,我們就來一步步地揭開Office新文件格式OOXML的真面目:
新建一個(gè)Word文檔,添加一些內(nèi)容,稍后我們將通過修改XML文件修改這些內(nèi)容:

將新建的文檔保存為docx格式:

修改docx文件的后綴為zip(這一步揭示了docx文件的本質(zhì),實(shí)際上它是一個(gè)zip壓縮文件)
