我們談到“文本處理”時,我們通常是指處理的內(nèi)容。Python 將文本文件的內(nèi)容讀入可以操作的字符串變量非常容易。文件對象提供了三個“讀”方法: .read()、.readline() 和 .readlines()。每種方法可以接受一個變量以限制每次讀取的數(shù)據(jù)量,但它們通常不使用變量。 .read() 每次讀取整個文件,它通常用于將文件內(nèi)容放到一個字符串變量中。然而 .read() 生成文件內(nèi)容最直接的字符串表示,但對于連續(xù)的面向行的處理,它卻是不必要的,并且如果文件大于可用內(nèi)存,則不可能實現(xiàn)這種處理。
.readline() 和 .readlines() 非常相似。它們都在類似于以下的結(jié)構(gòu)中使用:
Python .readlines() 示例
fh = open( 'c:\\autoexec.bat') for line in fh.readlines(): print line.readline() 和 .readlines()之間的差異是后者一次讀取整個文件,象 .read()一樣。.readlines()自動將文件內(nèi)容分析成一個行的列表,該列表可以由 Python 的 for... in ... 結(jié)構(gòu)進行處理。另一方面,.readline()每次只讀取一行,通常比 .readlines()慢得多。僅當沒有足夠內(nèi)存可以一次讀取整個文件時,才應(yīng)該使用.readline()。
寫:
writeline()是輸出后換行,下次寫會在下一行寫。write()是輸出后光標在行末不會換行,下次寫會接著這行寫
- 通過readline輸出,對于比較大的文件,這種占用內(nèi)存比較小。
- #coding:utf-8
-
- f = open('poem.txt','r')
- result = list()
- for line in open('poem.txt'):
- line = f.readline()
- print line
- result.append(line)
- print result
- f.close()
- open('result-readline.txt', 'w').write('%s' % '\n'.join(result))
- #coding:utf-8
- '''''cdays-4-exercise-6.py 文件基本操作
- @note: 文件讀取寫入, 列表排序, 字符串操作
- @see: 字符串各方法可參考hekp(str)或Python在線文檔http://docs.python.org/lib/string-methods.html
- '''
-
- f = open('cdays-4-test.txt', 'r') #以讀方式打開文件
- result = list()
- for line in f.readlines(): #依次讀取每行
- line = line.strip() #去掉每行頭尾空白
- if not len(line) or line.startswith('#'): #判斷是否是空行或注釋行
- continue #是的話,跳過不處理
- result.append(line) #保存
- result.sort() #排序結(jié)果
- print result
- open('cdays-4-result.txt', 'w').write('%s' % '\n'.join(result)) #保存入結(jié)果文件
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。