POJ 3167 Cow Patterns 牛题

此题只有130人solved！也算小牛题了，刚开始看到的时候，打算不做了的，但后来想了一下，发现有一点点思路。
经过好几个小时的奋战，居然做出来了！那感觉非常爽！

思路：

首先此题的变态之处是，要求比较的是排名，就不是单纯的字符串匹配了。
如果每次都重新求排名然后跟pattern比较，复杂度 O(NK)，八成会超时。
关键是：
一，不能每次都重新求排名
二，不能逐个逐个的和pattern做比较
看来也只有动态规划或者hash能满足这种需求。

对于前 K 个数字，求出一个初始的 hash 值。
对于后 N - K 个数字，不断的把大小为 K 的窗口向后一格格滑动，比如 [1, 5] -> [2, 6] -> [3, 7]。
hash 值随之更新，如果和pattern的hash值一致，那么当前的区间就是一个答案了。

一开始，想到的hash函数是，
hash = rank[1] * a[1] + rank[2] * a[2] + ... rank[K] * a[K]
其中：
所有数字的类型都为32bit无符号整数
数组 a 为等差数列
rank 为着窗口内的排名，跟 pattern 的格式一样，长度为 K。

由于 S <= 25 ，所以可以把数值相同的元素保存在一起，因它们的rank值也是一样的，
那 hash 函数就变成了这样子：
hash = 1 * (a[1] + a[3] ...) + 2 * (a[2] + a[7] + ...) + ...
其中 rank[1] = rank[3] = 1，rank[2] = rank[7] = 2。。。
可以维护大小为 S 的数组 pos 、rank_val：
pos[i] = { 元素 i 出现的位置对应的 hash 值，如果没出现过，则为 0 }
pos[1] = a[1] + a[3] + ...
pos[2] = a[2] + a[7] + ...
。。。
rank_val[i] = { 元素 i 对应的 rank }
rank_avl[1] = 1
rank_avl[2] = 2
。。。
因而：
hash = rank_val[1] * pos[1] + rank_val[2] * pos[2] + ... + rank_val[K] * pos[K]

窗口每次滑动一格的时候，都要先增加一个元素，然后减掉一个元素。
再维护一个大小为 S 的数组 cnt：
cnt[i] = { 元素 i 在窗口中出现的次数 }
这样，每次增删元素的时候，就很容易得出 rank_val 数组的内容了，就跟基数排序一个原理。

增加元素 i 的时候，首先增加 pos[i], cnt[i] 的值，然后扫描一遍 cnt 更新 rank_val 的值。
删除元素的情况类似。

窗口向后移动了一格之后：
pos[2] = a[2] + a[7]
应该变化为
pos[2] = a[1] + a[6]
这时候，由于 a 是等差数列，假设它的公差为 d，那么只需要 pos[2] -= cnt[2] * d 就能在 O(1) 时间内完成这种“移动”操作了！

因此，在窗口移动一格的过程中，步骤为：
一，增加窗口末尾后的第一个元素
二，删除窗口开头元素
三，“移动”窗口中所有元素
四，与 pattern 比较 hash 值

总的时间复杂度是 O(NS)。

后来，发现有的数据过不了，hash 冲突了，又将 hash 函数变化了一下：
hash = rank_val[1]^5 * pos[1] + rank_val[1]^5 * pos[2] ... rank_val[K]^5 * pos[K]
发现求到 4 次方的时候貌似还是有冲突。。。
到 5 次方的时候就 AC 了！

代码跑了 350 ms

代码：

#include <stdio.h>

#define MAX_K 25032

#define MAX_N 100032

#define MAX_S 32

#define HASH_START 0xdead

#define HASH_INC 0xbeef

struct spot_node {

unsigned int cnt, rank, sum;

};

struct seq_node {

struct spot_node spot[MAX_S];

unsigned int hash;

};

struct seq_node ptn, seq;

unsigned int N, K, S;

unsigned int hash_idx[MAX_K], in[MAX_N + MAX_K], rank_pow[MAX_S];

unsigned int ans[MAX_N], ans_cnt;

#define always_inline __inline

always_inline unsigned int rank_hash(unsigned int i)

{

return rank_pow[i];

}

always_inline void seq_insert(struct seq_node *s, unsigned int val)

{

struct spot_node *t;

t = &s->spot[val];

t->cnt++;

t->sum += hash_idx[K + 1];

s->hash += hash_idx[K + 1] * rank_hash(t->rank);

if (t->cnt != 1)

return ;

for (val++; val <= S; val++) {

t = &s->spot[val];

s->hash += t->sum * (rank_hash(t->rank + 1) - rank_hash(t->rank));

t->rank++;

}

always_inline void seq_delete(struct seq_node *s, unsigned int val)

{

struct spot_node *t;

t = &s->spot[val];

t->cnt--;

t->sum -= hash_idx[1];

s->hash -= hash_idx[1] * rank_hash(t->rank);

if (t->cnt != 0)

return ;

for (val++; val <= S; val++) {

t = &s->spot[val];

s->hash -= t->sum * (rank_hash(t->rank) - rank_hash(t->rank - 1));

t->rank--;

}

always_inline void seq_advance(struct seq_node *s)

{

unsigned int i;

struct spot_node *t;

for (i = 1; i <= S; i++) {

t = &s->spot[i];

s->hash -= t->cnt * rank_hash(t->rank) * HASH_INC;

t->sum -= t->cnt * HASH_INC;

}

always_inline void seq_init(struct seq_node *s, unsigned int *arr)

{

unsigned int i, r;

struct spot_node *t;

s->hash = 0;

for (i = 1; i <= K; i++) {

t = &s->spot[*arr++];

t->sum += hash_idx[i];

t->cnt++;

}

for (i = r = 1; i <= S; i++) {

t = &s->spot[i];

t->rank = r;

if (t->cnt) {

s->hash += rank_hash(t->rank) * t->sum;

r++;

}

int main()

{

unsigned int i;

freopen("e:\\test\\in.txt", "r", stdin);

scanf("%d%d%d", &N, &K, &S);

for (i = 0; i < N + K; i++)

scanf("%d", &in[i]);

hash_idx[1] = HASH_START;

for (i = 2; i <= K + 1; i++)

hash_idx[i] = hash_idx[i - 1] + HASH_INC;

for (i = 1; i <= S; i++)

rank_pow[i] = i * i * i * i * i;

seq_init(&ptn, in + N);

seq_init(&seq, in);

for (i = K; ; i++) {

if (seq.hash == ptn.hash)

ans[ans_cnt++] = i - K + 1;

if (i == N)

break;

seq_insert(&seq, in[i]);

seq_delete(&seq, in[i - K]);

seq_advance(&seq);

}

printf("%d\n", ans_cnt);

for (i = 0; i < ans_cnt; i++)

printf("%d\n", ans[i]);

return 0;

}

posted on 2010-03-18 15:30 糯米阅读(1240) 评论(2) 编辑收藏引用所属分类: POJ

# re: POJ 3167 Cow Patterns 牛题回复 更多评论

这个是用KMP做..

2010-04-05 17:24 | cnx

# re: POJ 3167 Cow Patterns 牛题[未登录] 回复 更多评论

@cnx
Disscuss里面有人说过用KMP做，但我就是想不通怎么用做。。
能否给个思路？

2010-04-05 17:26 | 糯米

刷新评论列表

只有注册用户登录后才能发表评论。


相关文章: POJ 3123 Ticket to Ride 高效解法 POJ 3123 Ticket to Ride 动态规划+Minimal Steiner Tree Minimal Steiner Tree 简介 POJ 3122 Pie 二分 POJ 3121 The SetStack Computer 哈希 POJ 3120 Sudoku 搜索 POJ 3156 Interconnect 图论+数论 POJ 3155 Hard Life 最大密度子图 POJ 3154 Graveyard 模拟 POJ 3150 Cellular Automaton 矩阵乘法+二分

网站导航: 博客园博客园最新博文博问管理

# re: POJ 3167 Cow Patterns 牛题回复 更多评论

# re: POJ 3167 Cow Patterns 牛题[未登录] 回复 更多评论

糯米