sed 스트림 편집기
ed명령어와 grep명령어 기능의 일부를 합친 것이 sed(stream editor)명령어이다.
sed명령어도 grep명령어와 같은 필터이지만 이 명령어는 화일을 수정할 수 있게 하는 반면 ed처럼 대화식처리는 불가능하다. sed 명령어는 1개 라인씩 입력 라인을 읽어들여 표준 출력에 출력한다.
sed는 각 라인을 읽을 때마다 ed에서 사용하던 형식의 대치작업을 실행한다.
일치하는 문자열이 있으면 그 문자열을 대치한 후 출력하고 일치하는 문자열이 없으면 그 라인은 수정되지 않고 그대로 출력된다.
이 sed 명령어가 ed보다 좋은 점은 라인들을 하나씩 읽고 , 수정하고, 출력하기 때문에 기억장치 안의 버퍼를 사용하지 않는다는 것이다. 버퍼를 사용하지 않으면 화일의 크기에 제한 없이 작업을 할 수 있다.
ed와 같이 버퍼를 사용하는 경우는 버퍼의 크기보다 큰 화일은 처리할 수 없으며 대개 버퍼의 크기는 1MB정도이다. 따라서 sed는 아주 큰 화일을 처리할 때 주로 사용된다.
sed 명령어를 호출하는 형식은 grep명령어와 같지만 완전한 형식의 대치 연산자를 사용한다는 점만이 다르다.
# sed "s/hello/goodbye" in.file
위의 명령어는 in.file이라는 화일에 있는 각 라인에서 첫번째 등장하는 hello라는 문자열을 goodbye로 교체한 후 그 라인을 표준 출력에 출력한다.
# echo "1234hello5678" | sed "s/hello/goodbye/"
대치 명령어를 따옴표로 둘러싸야 올바로 사용할 수 있다. 여기서 문자열은 정규식으로 표현될수 도 있다. 그외에도 sed명령어에는 여러 가지 연산자를 사용할 수 있다. 다음의 명령어를 사용하면 hello라는 문자열을 포함하고 있는 모든 문자열을 삭제할 수 있다.
# sed "/hello/d" in.file
위 명령어의 의미는 "hello라는 문자열을 포함하고 있는 라인을 찾아 그 라인을 삭제하라"는 것이다.
이 sed 명령어는 다음 명령어와 같은 의미이다.
# grep -v hello in.file
라인을 전부 삭제하지 않고 hello라는 문자열만을 삭제하려면 다음 명령어를 사용하다.
# sed "s/hello//" in.file
ed와 같이 sed에서도 화일의 일부만을 대상으로 작업하는 경우는 라인의 범위를 지정할 수 있다.
# sed "3,7s/hello//" in.file
위의 명령어는 in.file이라는 화일의 라인3에서 7까지만을 대상으로 첫번째 hello를 삭제하고 화일의 그 외의 부분은 변경시키지 않는다. 또한 다음과 같이 사용하면 라인 번호 대신 문맥을 범위로 지정할 수 있다.
# sed "/hello/,/goodbye/s/bad/good/g" in.file
위의 명령어는 hello라는 단어를 포함하고 있는 첫번째 라인부터 goodbye라는 단어를 포함하고 있는 라인까지 검색하면서 bad라는 문자열을 모두 good으로 변경한다.
또한 문자열 goodbye를 만난 이후에도 다시 다른 hello가 등장하면 다음 goodbye가 나올 때까지 대치 작업은 반복된다.
sed명령어의 기능은 지금까지 우리가 살펴본 것보다 더 강력하다.
sed명령어의 -f(file)선택자를 사용하면 명령어를 일일이 키보드에서 입력하지 않고 하나의 파일에 기억시켜 놓고 사용할 수도 있다.
# sed -f command.file in.file
여러 개의 명령어를 연속적으로 자주 사용할 때 이 명령어 화일이 유용하게 사용된다.
예를 들어 다음과 같은복수 개의 명령어가 화일에 기억되어 있는 경우는
# vi command.file
s/hello/goodbye/
s/good/bad/
다음과 같은 명령어를 입력하면
# echo "1234hello5678" | sed -f command.file
다음과 같이 출력된다.
# echo "1234hello5678" | sed -f command.file
1234badbye5678
o sed 기본
# sed '' ljs --> cat ljs 와 동일
o sed 편집 명령어
일상적인 sed 명령
---------------------------------------------------------------------------------------
a 다음 라인(들)을 적용될 라인들에 부가한다 (라인뒤)
c 적용될 라인들을 다음 라인(들)로 변경한다 (라인 대체)
d 적용될 라인들을 삭제한다
g 단지 첫번째의 것만이 아니라 라인의 모든 부합 패턴 대체가 적용 되게 한다
i 다음 라인(들)을 적용될 라인들 위에 삽입한다 (라인앞)
p - n 옵션하에 있을지라도, 라인을 프린트한다
q 명시된 라인에 도달할 때 중지한다
r filename filename을 판독한다. 내용을 출력에 부가한다
s/old/new/ "old"를 "new"로 대체한다
= 라인 번호를 프린트한다
!command 라인이 선택되지 않는 경우 command를 적용한다.
--------------------------------------------------------------------------------------
o 라인 명시
sed명령은 두가지 방법을 사용한다. 첫 번째는 번지를 번호로 명시하는것이다.
여러분은 특정한 라인을 가리키기 위해 단일 번호를 사용할 수 있다.
# sed '3d' ljs --> 세번째 라인을 삭제
또는, 라인들의 범위를 가리키기 위해 콤마(,)로 분리된 두 번호들을 사용할 수 있다.
# sed '2,4 s/e/#/' ljs --> 대체 명령은 단지 2-4 라인들에만 적용된다. (단순 대체 명령은 라인에서 첫번째 어커런스에만 적용된다는 점을 기억하라. 따라서 각 적용 라인의 첫 번째 e만이 #로 대체된다)
# sed -n '/kingdom/p' ljs --> kingdom이 들어있는 line만 프린트
# sed '/kingdom/p' ljs --> 모든 line이 나타나고 그와 동시에 kingdom line이 중복해서 나타남
# sed '[Pp]rincess/d' ljs --> princess 또는 Princess를 포함하고 있는 라인들을 삭제함
# sed '1,/fragrant/d' ljs --> 라인 1로부터 fragrant를 포함하고 있는 첫번째 라인까지의 모든 라인들을 삭제함
o sed 명령 하이라이트
# more ljs
I am a boy
You are a girk
He is a doctor
# sed 'a\
Hey !' ljs --> 각 라인뒤에다 Hey la la!를 입력
I am a boy
Hey !
You are a girk
Hey !
He is a doctor
Hey !
# sed 'a\
Oh! good\ --> 을 사용함으로써 하나 이상의 라인들을 부가할 수 있다
yeh' ljs
# sed '3a\
Good Morning' ljs --> 3 line뒤에다 내용 삽입
# sed 'c\
Oh marvelous delight! sing to me! ' ljs --> 기존의 라인들을 이것으로 대체시킴
Oh marvelous delight! sing to me!
Oh marvelous delight! sing to me!
Oh marvelous delight! sing to me!
# sed '2q' ljs = sed 2q ljs --> q명령은 편집기로 하여금 그것이 명시된 라인에 도착한 뒤
중지하게 한다. 즉 2라인만 보여줌
# sed -n '1s/a/#/gp' ljs --> 전체적으로 바꿔줌
o sed의 패턴-부합
패턴-부합에 대한 sed메타 문자
-------------------------------------------------------------------
메타 문자 작 용
-------------------------------------------------------------------
\ 다음 문자의 특수한 의미를 부정한다
^ 라인의 시작과 부합한다
$ 라인의 끝과 부합한다
. 어떠한 단일 문자와도 부합한다
[ ] 둘러싸인 문자들 중의 어느 하나와 부합한다
[^...] ...리스트에 없는 어떠한 문자와도 부합한다
pat* 0 또는 그 이상의 pat 어커런스들과 부합한다
여기에서 pat는 단일문자 또는 [ ]패턴이다
& s 명령의 newpattern부분에서 사용되어 oldpattern
부분의 재 산출을 나타낸다
-------------------------------------------------------------------
o 간략한 예--------------------------------------------
명 령 결 과
-----------------------------------------------------
/Second/ Second를 포함하고 있는 어떠한 라인과도 부합한다.
/^Second/ Second로 시작하는 어떠한 라인과도 부합한다.
/^$/ 공백라인, 즉 라인의 시작과 끝 사이에 아무것도 없는 라인과 부합한다.
이것은 공백 스페이스들로 된 라인과는 부합하지 않는바, 스페이스 자체가
문자이기 때문이다.
/c.t/ cat, cot, 기타 등을 포함하고 있는 라인들과 부합한다. 이 패턴은 단어의
일부일 수 있음에 유의하라. 예를 들어, apricot와 acute도 부합된다.
/./ 적어도 한 문자를 포함하고 있는 라인들과 부합한다.
/\./ 피리어드를 포함하고 있는 라인들과 부합한다. 는 .의 특수한 의미를 부정
/s[oa]p/ sop또는 sap와는 부합하지만 sip 또는 sup와는 부합하지 않는다.
/s[ ^oa]p/ sip또는 sup와는 부합하지만 sop또는 sap와는 부합하지 않는다.
s/cow/s&s/ cow를 scows로 대체한다.
/co*t/ * --> 어떠한 수
----------------------------------------------------------------------------------------
o 간단한 sed 해법
# sed '/^$/d' ljs --> 모든 공백 라인 제거
# sed '/^ *$/d' --> space로 만들어진 공백까지 제거 (조심! ^와 *사이에 공백이 있어야 한다)
# sed 'a\
' ljs --> 각 line마다 공백라인 추가
# sed '/^#/d' ljs --> 첫번째 열에 #을 가진 라인 제거
# sed 's/^/ /' ljs --> 각 line의 시작을 5 space로 대체
o 다중 명령
# sed 's/Bob/Robert/g
s/Pat/Patricia/g' ljs --> sh을 사용하는 경우에는 을 생략하라
# sed 's/cat/dog/g
s/dog/pigs/g' ljs --> 먼저 모든 cats를 dogs로 변환한 다음에 모든 dogs를 pigs로 변환한다.
# sed 's/Bob/Robert/g
s/Pat[^a-z]/Patricia/g' ljs --> ^a-z은 a에서 z까지의 문자들이 아닌 모든 문자를
의미한다는 점을 상기하라
o 태그
위에서 Pat!와 같은 것이 발견될때 !를 포함한 전체 문자열이 Patricia로 대체되므로 !가 소실된다.
우리는 !를 유지하면서 Pat를 대체하는 방법을 필요로 한다. 우리는 이것을 태그(tag)를 사용하여
수행할 수 있다. 패턴의 일부를 "태그"하려면, 그것을 좌측에는 (로 우측에는 )로 둘러싸라.
그 다음에, 명령의 newpattern부분에서, 여러분은 그렇게 둘러싸인 패턴의 첫 번째 것은 1로,
두번째 것은 2 등으로 인용할 수 있다. 이 방법을 사용하면 다음의 명령이 부여된다.
# sed 's/(Pat)([^a-z])/1ricia2/g' ljs
o 쉘 스크립트와 sed
# vi twospace
sed 'a\
' $* --> $*은 모든 인자들을 나타냄
# twospace ljs | pr | lpr
위 예는 sed가 어떻게 하여 UNIX 프로그래밍과 쉘 스크립트에 적합한가를 나타낸다.
출처 : Tong - 굿보이군님의 Linux통
옵션
d - 라인을 지우기
p - 라인을 출력
r - 파일을 읽음
s - 다른 문자를 읽음
sed -n '/west/p' data.file - grep과 같은 라인 출력
sed -n '3,5p' /opt/data.file - 3에서 5번줄까지 출력
sed -n '/Chris/,$p' data.file - data.file 안에 Chris부터 끝까지 출력
sed 's/3/X/' data.file - data.file 안에 3을 X로 변환(라인당 하나만 변환)
sed 's/3/X/g' data.file - data.file 안에 3을 모두 X로 변환
sed -n '/(tab)[0-9]$/p' data.file - 파일안에 tab이후에 0-9가 들어가고 줄끝문자가 이어지는 라인만 출력
sed -n '/(tab)[0-9]$/& HITE/p' data.file - 파일안에 조건에 맞는 라인에 끝에 HITE라는 문자 추가(여기서의 $는 ~부터 끝까지가 아닌 줄끝 문자의 의미를 가진다)
sed '/west/d' data.file - 파일안에 west를 빼고 출력
sed '/May/,/TJ/d' data.file - 파일안에 May부터 TJ까지 빼고 출력
sed '/west/r /opt/mess' data.file - 파일안에 west가 들어가는 라인에 mess란 파일 데이터를 읽어드려 추가
cat > 1.sed
1,4d - 1,4를 지움
s/north/North/ - north를 찾아 North로 변경
s/^east/East/ - east로 시작하는 라인을 찾아 East로 변경
sed -f 1.sed data.file - 파일안에 라인을 1.sed에 따라 연속처리
-n 옵션에 대해 - -n 옵션이 들어가면 라인출력인 p가 붙어야 화면에 출력한다. 반대로 -n이 없을 경우 p가 붙지 않아도 출력하며 p가 있을 경우 두번 출력해 주는 형식이 된다.
http://blog.naver.com/siyang6/30021355074
'*nix' 카테고리의 다른 글
man에서 한글 깨짐 (0) | 2010.06.14 |
---|---|
Unix 프로세스 Job Control (0) | 2010.06.14 |
vi 특정문자열 삭제 (0) | 2010.06.01 |
로그파일 가공하기 (0) | 2010.05.17 |
awk 사용법 (0) | 2010.05.17 |