본문 바로가기
Node.js

[Cheerio] 현재 태그의 텍스트만 가져오기

by pocket.dev 2024. 6. 19.
반응형

node.js

 

크롤링 할 때 Cheerio 패키지를 사용했다. 현재 노드의 텍스트를 뽑아내고 싶은데, text() 함수를 사용했을 때, 하위 노드의 텍스트도 모두 뽑아내는 것을 확인했다.

 

.text()를 쓰면 하위 태그의 텍스트도 다 긁어온다. 예를 들어 만약 <td> 태그 안에 <p> 태그가 있다면 <p> 태그 속에 있는 텍스트도 함께 긁어온다.

$('td').text()

 

하지만 selector로 고른 현재 태그의 텍스트만 뽑아오고 싶다면, 아래처럼 작성하면 된다.

$('td').contents().first().text()