[코딩테스트/Python] 프로그래머스 코딩테스트 - 문자열 압축

2024. 10. 4. 14:26·Minding's Programming/프로그래머스 코딩테스트
728x90
반응형

문제 설명
데이터 처리 전문가가 되고 싶은 "어피치"는 문자열을 압축하는 방법에 대해 공부를 하고 있습니다. 최근에 대량의 데이터 처리를 위한 간단한 비손실 압축 방법에 대해 공부를 하고 있는데, 문자열에서 같은 값이 연속해서 나타나는 것을 그 문자의 개수와 반복되는 값으로 표현하여 더 짧은 문자열로 줄여서 표현하는 알고리즘을 공부하고 있습니다.
간단한 예로 "aabbaccc"의 경우 "2a2ba3c"(문자가 반복되지 않아 한번만 나타난 경우 1은 생략함)와 같이 표현할 수 있는데, 이러한 방식은 반복되는 문자가 적은 경우 압축률이 낮다는 단점이 있습니다. 예를 들면, "abcabcdede"와 같은 문자열은 전혀 압축되지 않습니다. "어피치"는 이러한 단점을 해결하기 위해 문자열을 1개 이상의 단위로 잘라서 압축하여 더 짧은 문자열로 표현할 수 있는지 방법을 찾아보려고 합니다.

예를 들어, "ababcdcdababcdcd"의 경우 문자를 1개 단위로 자르면 전혀 압축되지 않지만, 2개 단위로 잘라서 압축한다면 "2ab2cd2ab2cd"로 표현할 수 있습니다. 다른 방법으로 8개 단위로 잘라서 압축한다면 "2ababcdcd"로 표현할 수 있으며, 이때가 가장 짧게 압축하여 표현할 수 있는 방법입니다.

다른 예로, "abcabcdede"와 같은 경우, 문자를 2개 단위로 잘라서 압축하면 "abcabc2de"가 되지만, 3개 단위로 자른다면 "2abcdede"가 되어 3개 단위가 가장 짧은 압축 방법이 됩니다. 이때 3개 단위로 자르고 마지막에 남는 문자열은 그대로 붙여주면 됩니다.

압축할 문자열 s가 매개변수로 주어질 때, 위에 설명한 방법으로 1개 이상 단위로 문자열을 잘라 압축하여 표현한 문자열 중 가장 짧은 것의 길이를 return 하도록 solution 함수를 완성해주세요.

제한사항
s의 길이는 1 이상 1,000 이하입니다.
s는 알파벳 소문자로만 이루어져 있습니다.


입출력 예

 

문제 풀이

def solution(s):
    # 문자열 길이가 1인 경우 바로 반환
    if len(s) == 1:
        return 1

    minimum = len(s)

    # 1부터 문자열 길이의 절반까지 자를 단위를 설정
    for i in range(1, len(s) // 2 + 1):
        compressed = ''
        prev = s[0:i]  # 첫 단위
        cnt = 1  # 같은 단위가 몇 번 반복되는지 세는 변수
        
        # i 단위로 문자열을 자르면서 반복 확인
        for j in range(i, len(s), i):
            if s[j:j+i] == prev:
                cnt += 1
            else:
                # 반복이 끝나면, cnt를 보고 압축
                if cnt > 1:
                    compressed += str(cnt) + prev
                else:
                    compressed += prev
                prev = s[j:j+i]  # 새로운 단위 설정
                cnt = 1
        
        # 남은 마지막 부분 처리
        if cnt > 1:
            compressed += str(cnt) + prev
        else:
            compressed += prev

        # 압축된 문자열의 길이 확인 및 갱신
        minimum = min(minimum, len(compressed))

    return minimum

2020년 KAKAO 블라인드 코딩테스트에 참여했을 때 분명 풀어본 문제인데, 최근 코테 연습을 안하다보니 한참 걸렸다.

 

기본적으로 이중 반복문을 통해 하나씩 비교하는 개념은 바로 떠올랐지만, 그걸 코드로 구현하는데 꽤나 애를 먹었다.

 

기준이 되는 문자열을 prev로 지정한 다음, i 배수 별로 건너뛰면서(j 반복문 부분) 다음 문자열과 비교를 하는 방식으로 구현했다.

 

그리고 맨 마지막 부분은 다음 문자열이 없어 변환한 문자열에 포함이 되지 않을 수 있기 때문에, 남은 마지막 부분을 처리하는 부분까지 추가해주었다. (이 부분에서 또 애를 먹었다.)

 

변환된 문자열을 현재 최소 길이 문자열과 비교해 더 짧은 것이 minimum 변수에 저장되도록 했다.

 

꾸준히 코테 공부를 해야겠다...

728x90

'Minding's Programming > 프로그래머스 코딩테스트' 카테고리의 다른 글

[프로그래머스 코딩테스트/MySQL] 특정 물고기를 잡은 총 수 구하기  (0) 2025.01.21
[코딩테스트/Python] 프로그래머스 코딩테스트 - 주사위 게임 3  (0) 2024.10.02
[코딩테스트/Python] 프로그래머스 코딩테스트 - 사탕 담기  (0) 2024.09.30
[코딩테스트/Python] 프로그래머스 코딩테스트 - 운송 트럭  (1) 2024.09.30
[코딩테스트/Python] 프로그래머스 코딩테스트 - 나머지 한 점  (1) 2024.09.30
'Minding's Programming/프로그래머스 코딩테스트' 카테고리의 다른 글
  • [프로그래머스 코딩테스트/MySQL] 특정 물고기를 잡은 총 수 구하기
  • [코딩테스트/Python] 프로그래머스 코딩테스트 - 주사위 게임 3
  • [코딩테스트/Python] 프로그래머스 코딩테스트 - 사탕 담기
  • [코딩테스트/Python] 프로그래머스 코딩테스트 - 운송 트럭
Minding
Minding
  • Minding
    Today's Minding
    Minding
  • 전체
    오늘
    어제
    • 울고넘는 딥러닝 (278)
      • Minding's Baseball (57)
        • MLB Statcast (29)
        • 머신러닝으로 홈런왕 예측하기 (3)
        • 야구칼럼 (12)
        • 야구 규칙, 용어 (1)
        • 2022-23 질롱 코리아 (8)
        • 류현진 등판경기 (4)
      • Minding's Programming (185)
        • 프로그래머스 코딩테스트 (21)
        • Knowledge (44)
        • Numpy & Pandas (6)
        • Excel (3)
        • Git (1)
        • Pygame (11)
        • CV (3)
        • Tensorflow tutorial (4)
        • Kaggle and Dacon (4)
        • 에러 코드 (8)
        • FastAPI (8)
        • Airflow (29)
        • Crawling (6)
        • Django (14)
        • AWS (18)
        • Spark (5)
      • Minding's Reading (30)
        • 머신러닝 딥러닝에 필요한 기초 수학 with 파이.. (2)
        • 칼만필터는 어렵지 않아 (11)
        • 밑바닥부터 시작하는 딥러닝 (6)
        • 메이저리그 야구 통계학 2e (8)
        • 논문읽기 (2)
        • 빅데이터를 지탱하는 기술 (1)
      • Minding's Life (5)
        • 주식 (4)
        • 각종 소식 (1)
  • 블로그 메뉴

    • 홈
    • Baseball
    • Programming
    • Reading
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    데이터분석
    머신러닝
    데이터 엔지니어
    django
    칼만필터는어렵지않아
    메이저리그
    야구
    mlb stats api
    칼만필터는어렵지않아파이썬
    칼만필터는어렵지않아python
    KBO
    파이썬게임개발
    칼만필터
    파이썬
    django python
    게임개발
    질롱코리아
    KalmanFilter
    에어플로우
    프로그래머스
    Airflow
    딥러닝
    pygame
    AWS
    파이게임
    FastAPI
    MLB
    코딩테스트
    Python
    넘파이
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
Minding
[코딩테스트/Python] 프로그래머스 코딩테스트 - 문자열 압축
상단으로

티스토리툴바