BeMore
close
프로필 배경
프로필 로고

BeMore

  • Posts (53)
    • CS (4)
      • 데이터베이스 (4)
      • 네트워크 (1)
      • 운영체제 (0)
    • ML (1)
      • 추천 시스템 (1)
    • Ops (2)
      • 쿠버네티스 (2)
    • DataEngineering (10)
    • 개발개발 (6)
      • 이게 왜 안되지 (5)
    • 회고 (8)
    • 일상일상 (1)
      • 독서 (0)
  • Github

hive SerDe

케이스HDFS 경로의 파일을 대상으로 만든 Hive external table을 조회했을 때, 컬럼 값이 다음과 같이 비정상적으로 보였다.�����A����..처음에는 데이터 손상이나 스키마 문제인지 파악하기 위해 아래 항목들을 순서대로 확인했다.Hive 테이블 스키마가 실제 데이터 구조와 일치하는지테이블 컬럼 순서와 데이터프레임 컬럼 순서가 서로 다른지원본 Parquet 파일 자체에 이미 값이 깨져 있는지하지만 위 항목들에서는 특별한 이상이 없었다.즉, 원본 파일과 스키마 자체의 문제라기보다, Hive가 파일을 해석하는 방식에 문제가 있을 가능성이 더 커 보였다.원인SHOW CREATE TABLE, DESCRIBE FORMATTED로 테이블의 상세 설정을 확인해보니, 실제 데이터는 Parquet 파일이..

  • format_list_bulleted DataEngineering
  • · 2026. 3. 15.
  • textsms
  • navigate_before
  • 1
  • navigate_next
전체 카테고리
  • Posts (53)
    • CS (4)
      • 데이터베이스 (4)
      • 네트워크 (1)
      • 운영체제 (0)
    • ML (1)
      • 추천 시스템 (1)
    • Ops (2)
      • 쿠버네티스 (2)
    • DataEngineering (10)
    • 개발개발 (6)
      • 이게 왜 안되지 (5)
    • 회고 (8)
    • 일상일상 (1)
      • 독서 (0)
최근 글
인기 글
최근 댓글
태그
  • #오탈자 확인
  • #자료구조
  • #회고
  • #취준
  • #오블완
  • #블로그 이사
  • #M1
  • #티스토리챌린지
  • #이게 왜 안되지
  • #글또
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바