雁过无痕

C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合

:: 管理 ::

《编程之美》读书笔记21： 2.4 1的数目

问题：

给定一个十进制正整数N，写下从1开始，到N的所有整数，

然后数一下其中出现的所有“1”的个数。

例如：

N=2，写下 1，2。这样只出现了 1 个“1”。

N=12，我们会写下 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12。这样 1 的个数是 5。

1. 写一个函数f(N)，返回1到N之间出现的“1”的个数,比如f(12)=5。

2. 在32位整数范围内，满足条件“f(N)= N”的最大的N是多少？

曾在ChinaUnix论坛上看到该题，记得是google的面试题，有个网友给出了不错的解法，但他给出的证明倒是有点复杂，一直记不住。今天，无意间翻到这题，就顺便再解了下。

对问题一，可以采用书上的方法，分别对每个位进行统计。

对问题二，可以证明N的上限值是10^10-1，不过就是采用10^11-1，对后面采用的算法影响也不大（只是多循环了300多次）。

假设： a < c <b，c = f(c)

由函数f的定义可知：f(a) <= f(c) <= f(b)，

即： f(a) <= c <= f(b)，

又由 a< c < b可得 a + 1 <= c <= b-1

因而 max(a+1, f(a)) <= c <= min(b-1, f(b)) 　①

假设 c含有k个数字，由于a每增加1，f(a)最多增加k。

则有： f(c) <= f(a) + (c - a) * k

由 f(c) = c > c – 1 可得 c – 1 < f(a) + (c - a) * k

即： c > (a*k – f(a) - 1) / (k - 1) = a + (a – f(a) - 1) / (k - 1)

即： c >= a + (a – f(a) - 1) / (k - 1) + 1 ( k > = 2) ②

当取等号时，c = a + (a – f(a) - 1) / (k - 1) + 1 <= a + (a – f(a) - 1) / 1 + 1 = a + (a – f(a))

因而c的位数k小等于a + (a – f(a))的位数。

假设b含有t个数字：

同理可得 f(b) – 1 < f(b) <= f(c) + (b - c) * t = c + (b - c) * t 可得

c < (b * t – f(b) + 1) / (t - 1) = b - (f(b) - b - 1) / (t - 1)

即：c <= b - (f(b) – b - 1) / (t - 1) – 1 (t >= 2) ③

利用①、②、③这三个公式，可以去除不必要的计算。

由公式① max(a+1, f(a)) <= c

和公式② c >= a + (a – f(a) - 1) / (k - 1) + 1

可知：当计算了f(a)后，

若 a > f(a) 下一个要计算的是： a + (a – f(a) - 1) / (k - 1) + 1

若 a < f(a) 下一个要计算的是: f(a)

从1算到10^10-1，大概调用函数f四千多次，即可得到结果。

可以只利用公式①来计算。

max(a+1, f(a)) <= c <= min(b-1, f(b))

将要计算的范围划分为几个区间，然后对每个区间进行计算。比如说：

1到999，先将这些数划分为10个区间：1-99、100-199 … 900-999

由f(999) = 300可知，300以后的区间段可以不计算。当计算200时，可以先计算299，由于f(299)=160<200，200-299的区间可以都不必计算。对要计算的区间，再将它划分为10个区间，重复进行。这样划分的另一个好处是利用公式：f(10^n-1) ＝ n * 10^(n-1)，保存上次算得的f(n)直接计算下个数的f(n)。

还可以利用公式②、③倒着计算：即从10^10-1开始算起。

最高效的作法，可能是：先倒着计算，直到出现f(n) > n，然后再设计个算法划分区间，从区间前计算。交替进行。但前面的几种算法，效率都比较高，具体优化，效果并不明显。

下面的代码的算法采用倒着算，计算N=f(N)：

初始值	求Ｎ最大值，调用f函数次数	求所有Ｎ值，调用f函数次数
10^10-1	604	3164
10^11-1	979	3539

附：上限值证明：

假设n=a_k*10^k+ a_k-1*10^k-1+…+ a₁*10¹+ a₀*10⁰ ( a_k-1, a_k-2 … a₀>=0; a_k>=1)

① 非最高位中1出现的个数：

当最高位从0到a_k-1，其它k位数出现的1个数：先从k位中取一位为1，剩余的k-1位组成共可组成k*10^k-1个数，所以，1的个数总共为：a_k*k*10^k-1

最高位为a_k时，去除最高位后，剩余的数为n-a_k*10^k，其中1出现的个数为f(n-a_k*10^k)

② 最高位出现1的个数：

如果a_k>1，1出现的个数肯定大于a_k=1时1出现的个数，

a_k=1时最高位1出现的个数为：n-a_k*10^k+1

（若a_k>1 1出现的个数为 10^k）

所以 f(n)>= a_k*k*10^k-1+ n-a_k*10^k+1 + f(n-a_k*10^k) > a_k*(k/10 -1)* 10^k-1 + n

只要 k>=10，就有 f(n)>n

因此上限为 10¹⁰– 1。

#include<iostream>

using std::cout;

inline unsigned count_digits(unsigned long long num)

{

unsigned long long n = 1;

unsigned ret = 0;

while (n <= num) { n *= 10; ++ret; }

return ret;

}

unsigned long long count_ones(unsigned long long num)

{

unsigned long long count = 0, factor = 1;

unsigned long long low = 0, cur;

while (num != 0) {

cur = num % 10;

num /= 10;

unsigned long long tmp = 0;

if (cur > 1) tmp = factor;

else if (cur == 1) tmp = low + 1;

count += num * factor + tmp;

low += factor * cur;

factor *= 10;

}

return count;

}

void get_nums()

{

unsigned long long x = 1e11 - 1, y;

unsigned count = 0;

unsigned idx = 0;

while (true) {

++count;

y = count_ones(x);

if (x < y) {

//x在1到10时，均不满足x<y,所以x>10，下面的k值肯定大于0

unsigned k = count_digits(x) - 1;

x -= (y - x - 1)/k + 1;

}

else if (x > y) { x = y; }

else {

cout<< ++idx << ": " << x << " " << count << "\n";

//break;

--x;

if (x == 0) break;

}

int main()

{

get_nums();

}

posted on 2010-07-21 00:25 flyinghearts 阅读(1090) 评论(0) 编辑收藏引用所属分类: 算法、编程之美、C++

只有注册用户登录后才能发表评论。


相关文章: 面试题: 找出数组中三个只出现一次的数避免计算过程中出现溢出的一个技巧 Fibonacci数计算中的两个思维盲点及其扩展数列的通用高效解法喝汽水问题对环状数组求连续子数组的最大和最短摘要的生成（补充） Fibonacci数列的两种O(lgn)解法点在三角形内　之二（三维坐标系1）点在多边形内点在三角形内（1）

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

雁过无痕

留言簿(7)

随笔分类

随笔档案

搜索

最新随笔

最新评论

阅读排行榜

评论排行榜