糯米

TI DaVinci, gstreamer, ffmpeg
随笔 - 167, 文章 - 0, 评论 - 47, 引用 - 0
数据加载中……

POJ 3167 Cow Patterns 牛题

此题只有130人solved!也算小牛题了,刚开始看到的时候,打算不做了的,但后来想了一下,发现有一点点思路。
经过好几个小时的奋战,居然做出来了!那感觉非常爽!

思路:

首先此题的变态之处是,要求比较的是排名,就不是单纯的字符串匹配了。
如果每次都重新求排名然后跟pattern比较,复杂度 O(NK),八成会超时。
关键是:
一,不能每次都重新求排名
二,不能逐个逐个的和pattern做比较
看来也只有动态规划或者hash能满足这种需求。

对于前 K 个数字,求出一个初始的 hash 值。
对于后 N - K 个数字,不断的把大小为 K 的窗口向后一格格滑动,比如 [1, 5] -> [2, 6] -> [3, 7]。
hash 值随之更新,如果和pattern的hash值一致,那么当前的区间就是一个答案了。

一开始,想到的hash函数是,
hash = rank[1] * a[1] + rank[2] * a[2] + ... rank[K] * a[K]
其中:
所有数字的类型都为32bit无符号整数
数组 a 为等差数列
rank 为着窗口内的排名,跟 pattern 的格式一样,长度为 K。

由于 S <= 25 ,所以可以把数值相同的元素保存在一起,因它们的rank值也是一样的,
那 hash 函数就变成了这样子:
hash = 1 * (a[1] + a[3] ...) + 2 * (a[2] + a[7] + ...) + ...
其中 rank[1] = rank[3] = 1,rank[2] = rank[7] = 2。。。
可以维护大小为 S 的数组 pos 、rank_val:
pos[i] = { 元素 i 出现的位置对应的 hash 值,如果没出现过,则为 0 }
pos[1] = a[1] + a[3] + ...   
pos[2] = a[2] + a[7] + ...
。。。
rank_val[i] = { 元素 i 对应的 rank }
rank_avl[1] = 1
rank_avl[2] = 2
。。。
因而:
hash = rank_val[1] * pos[1] + rank_val[2]  * pos[2] + ...  + rank_val[K] * pos[K]

窗口每次滑动一格的时候,都要先增加一个元素,然后减掉一个元素。
再维护一个大小为 S 的数组 cnt:
cnt[i] = { 元素 i 在窗口中出现的次数 }
这样,每次增删元素的时候,就很容易得出 rank_val 数组的内容了,就跟基数排序一个原理。

增加元素 i 的时候,首先增加 pos[i], cnt[i] 的值,然后扫描一遍 cnt 更新 rank_val 的值。
删除元素的情况类似。

窗口向后移动了一格之后:
pos[2] = a[2] + a[7]
应该变化为
pos[2] = a[1] + a[6]
这时候,由于 a 是等差数列,假设它的公差为 d,那么只需要 pos[2] -= cnt[2] * d 就能在 O(1) 时间内完成这种“移动”操作了!

因此,在窗口移动一格的过程中,步骤为:
一,增加窗口末尾后的第一个元素
二,删除窗口开头元素
三,“移动”窗口中所有元素
四,与 pattern 比较 hash 值

总的时间复杂度是 O(NS)。

后来,发现有的数据过不了,hash 冲突了,又将 hash 函数变化了一下:
hash = rank_val[1]^5 * pos[1] + rank_val[1]^5 * pos[2] ... rank_val[K]^5 * pos[K]
发现求到 4 次方的时候貌似还是有冲突。。。
到 5 次方的时候就 AC 了!

代码跑了 350 ms

代码:
#include <stdio.h>

#define MAX_K 25032
#define MAX_N 100032
#define MAX_S 32
#define HASH_START 0xdead
#define HASH_INC 0xbeef

struct spot_node {
    unsigned 
int cnt, rank, sum;
}
;
struct seq_node {
    
struct spot_node spot[MAX_S];
    unsigned 
int hash;
}
;
struct seq_node ptn, seq;
unsigned 
int N, K, S;
unsigned 
int hash_idx[MAX_K], in[MAX_N + MAX_K], rank_pow[MAX_S];
unsigned 
int ans[MAX_N], ans_cnt;

#define always_inline __inline 

always_inline unsigned 
int rank_hash(unsigned int i)
{
    
return rank_pow[i];
}


always_inline 
void seq_insert(struct seq_node *s, unsigned int val)
{
    
struct spot_node *t;

    t 
= &s->spot[val];
    t
->cnt++;
    t
->sum += hash_idx[K + 1];
    s
->hash += hash_idx[K + 1* rank_hash(t->rank);
    
if (t->cnt != 1
        
return ;
    
for (val++; val <= S; val++{
        t 
= &s->spot[val];
        s
->hash += t->sum * (rank_hash(t->rank + 1- rank_hash(t->rank));
        t
->rank++;
    }

}


always_inline 
void seq_delete(struct seq_node *s, unsigned int val)
{
    
struct spot_node *t;

    t 
= &s->spot[val];
    t
->cnt--;
    t
->sum -= hash_idx[1];
    s
->hash -= hash_idx[1* rank_hash(t->rank);
    
if (t->cnt != 0
        
return ;
    
for (val++; val <= S; val++{
        t 
= &s->spot[val];
        s
->hash -= t->sum * (rank_hash(t->rank) - rank_hash(t->rank - 1));
        t
->rank--;
    }

}


always_inline 
void seq_advance(struct seq_node *s)
{
    unsigned 
int i;
    
struct spot_node *t;

    
for (i = 1; i <= S; i++{
        t 
= &s->spot[i];
        s
->hash -= t->cnt * rank_hash(t->rank) * HASH_INC;
        t
->sum -= t->cnt * HASH_INC;
    }

}


always_inline 
void seq_init(struct seq_node *s, unsigned int *arr)
{
    unsigned 
int i, r;
    
struct spot_node *t;

    s
->hash = 0;
    
for (i = 1; i <= K; i++{
        t 
= &s->spot[*arr++];
        t
->sum += hash_idx[i];
        t
->cnt++;
    }

    
for (i = r = 1; i <= S; i++{
        t 
= &s->spot[i];
        t
->rank = r;
        
if (t->cnt) {
            s
->hash += rank_hash(t->rank) * t->sum;
            r
++;
        }

    }

}


int main()
{
    unsigned 
int i;

    freopen(
"e:\\test\\in.txt""r", stdin);

    scanf(
"%d%d%d"&N, &K, &S);
    
for (i = 0; i < N + K; i++)
        scanf(
"%d"&in[i]);

    hash_idx[
1= HASH_START;
    
for (i = 2; i <= K + 1; i++)
        hash_idx[i] 
= hash_idx[i - 1+ HASH_INC;
    
for (i = 1; i <= S; i++)
        rank_pow[i] 
= i * i * i * i * i;

    seq_init(
&ptn, in + N);
    seq_init(
&seq, in);
    
for (i = K; ; i++{
        
if (seq.hash == ptn.hash) 
            ans[ans_cnt
++= i - K + 1;
        
if (i == N)
            
break;
        seq_insert(
&seq, in[i]);
        seq_delete(
&seq, in[i - K]);
        seq_advance(
&seq);
    }


    printf(
"%d\n", ans_cnt);
    
for (i = 0; i < ans_cnt; i++)
        printf(
"%d\n", ans[i]);

    
return 0;
}



posted on 2010-03-18 15:30 糯米 阅读(1177) 评论(2)  编辑 收藏 引用 所属分类: POJ

评论

# re: POJ 3167 Cow Patterns 牛题  回复  更多评论   

这个是用KMP做..
2010-04-05 17:24 | cnx

# re: POJ 3167 Cow Patterns 牛题[未登录]  回复  更多评论   

@cnx
Disscuss里面有人说过用KMP做,但我就是想不通怎么用做。。
能否给个思路?
2010-04-05 17:26 | 糯米

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理